Detail publikace

Compact Network for Speakerbeam Target Speaker Extraction

DELCROIX, M.; ŽMOLÍKOVÁ, K.; OCHIAI, T.; KINOSHITA, K.; ARAKI, S.; NAKATANI, T. Compact Network for Speakerbeam Target Speaker Extraction. In Proceedings of ICASSP. Brighton: IEEE Signal Processing Society, 2019. p. 6965-6969. ISBN: 978-1-5386-4658-8.
Název česky
Kompaktní síť pro SpeakerBeam extrakci mluvčího
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

Target speech extraction, Neural network, Adaptation, Auxiliary feature, Speech enhancement

Abstrakt

V tomto článku navrhujeme jednoduše škálovat aktivace skryté vrstvy sítě pro extrakci řeči s váhami odvozenými od pomocných funkcí. Tento jednodušší přístup výrazně snižuje počet parametrů modelu až o 60%, což je mnohem praktičtější při zachování podobné úrovně výkonu. Náš přístup jsme testovali na simulovaných a reálných hlučných a dozvukových směsích a ukázali jsme potenciál SpeakerBeam pro aplikace v reálném životě. Navíc jsme ukázali, že výkon SpeakerBeam pro extrakci řeči je srovnatelný s výkonem nejmodernější metody separace řeči s podobnou konfigurací sítě.

Rok
2019
Strany
6965–6969
Sborník
Proceedings of ICASSP
ISBN
978-1-5386-4658-8
Vydavatel
IEEE Signal Processing Society
Místo
Brighton
DOI
UT WoS
000482554007040
EID Scopus
BibTeX
@inproceedings{BUT160003,
  author="DELCROIX, M. and ŽMOLÍKOVÁ, K. and OCHIAI, T. and KINOSHITA, K. and ARAKI, S. and NAKATANI, T.",
  title="Compact Network for Speakerbeam Target Speaker Extraction",
  booktitle="Proceedings of ICASSP",
  year="2019",
  pages="6965--6969",
  publisher="IEEE Signal Processing Society",
  address="Brighton",
  doi="10.1109/ICASSP.2019.8683087",
  isbn="978-1-5386-4658-8",
  url="https://ieeexplore.ieee.org/document/8683087"
}
Nahoru