Detail publikace
Compact Network for Speakerbeam Target Speaker Extraction
DELCROIX, M.; ŽMOLÍKOVÁ, K.; OCHIAI, T.; KINOSHITA, K.; ARAKI, S.; NAKATANI, T. Compact Network for Speakerbeam Target Speaker Extraction. In Proceedings of ICASSP. Brighton: IEEE Signal Processing Society, 2019. p. 6965-6969. ISBN: 978-1-5386-4658-8.
Název česky
Kompaktní síť pro SpeakerBeam extrakci mluvčího
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Delcroix Marc
(FIT)
Žmolíková Kateřina, Ing., Ph.D. (FIT)
OCHIAI, T.
Kinoshita Keisuke (FIT)
ARAKI, S.
Nakatani Tomohiro (FIT)
Žmolíková Kateřina, Ing., Ph.D. (FIT)
OCHIAI, T.
Kinoshita Keisuke (FIT)
ARAKI, S.
Nakatani Tomohiro (FIT)
URL
Klíčová slova
Target speech extraction, Neural network, Adaptation, Auxiliary feature, Speech enhancement
Abstrakt
V tomto článku navrhujeme jednoduše škálovat aktivace skryté vrstvy sítě pro extrakci řeči s váhami odvozenými od pomocných funkcí. Tento jednodušší přístup výrazně snižuje počet parametrů modelu až o 60%, což je mnohem praktičtější při zachování podobné úrovně výkonu. Náš přístup jsme testovali na simulovaných a reálných hlučných a dozvukových směsích a ukázali jsme potenciál SpeakerBeam pro aplikace v reálném životě. Navíc jsme ukázali, že výkon SpeakerBeam pro extrakci řeči je srovnatelný s výkonem nejmodernější metody separace řeči s podobnou konfigurací sítě.
Rok
2019
Strany
6965–6969
Sborník
Proceedings of ICASSP
ISBN
978-1-5386-4658-8
Vydavatel
IEEE Signal Processing Society
Místo
Brighton
DOI
UT WoS
000482554007040
EID Scopus
BibTeX
@inproceedings{BUT160003,
author="DELCROIX, M. and ŽMOLÍKOVÁ, K. and OCHIAI, T. and KINOSHITA, K. and ARAKI, S. and NAKATANI, T.",
title="Compact Network for Speakerbeam Target Speaker Extraction",
booktitle="Proceedings of ICASSP",
year="2019",
pages="6965--6969",
publisher="IEEE Signal Processing Society",
address="Brighton",
doi="10.1109/ICASSP.2019.8683087",
isbn="978-1-5386-4658-8",
url="https://ieeexplore.ieee.org/document/8683087"
}