Detail publikace
Analysis of BUT Submission in Far-Field Scenarios of VOiCES 2019 Challenge
Plchot Oldřich, Ing., Ph.D. (UPGM)
Zeinali Hossein, Ph.D. (UPGM)
Mošner Ladislav, Ing. (UPGM)
Silnova Anna, M.Sc., Ph.D. (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Novotný Ondřej, Ing., Ph.D.
Glembek Ondřej, Ing., Ph.D.
Far-Field Scenarios, analysis, voices
Tento dokument je post-evaluační analýzou našeho úsilí ve výzvě VOiCES 2019 Speaker Recognition. Všechny systémy v pevném stavu jsou založeny na x-vektorech s různými funkcemi a topologiemi DNN. Jediný nejlepší systém dosahuje minDCF 0,38 (5,25% EER) a fúze 3 systémů přináší minDCF 0,34 (4,87% EER). Analyzujeme také, jak se systémy pro ověřování mluvčích (SV) vyvinuly v posledních několika letech, a výsledky zobrazujeme také na SITW 2016 výzva. EER o stavu jádro-jádro výzvy SITW 2016 klesl z 5,85% na 1,65% u systémových fúzí předložených pro SITW 2016 a VOiCES 2019. Méně omezující otevřená podmínka nám umožnila použít externí data pro přizpůsobení PLDA a dosáhnout dalšího malého zlepšení výkonu. V našem podání do otevřené podmínky jsme použili tři x-vektorové systémy a také jeden systém založený na i-vektorech.
@inproceedings{BUT159997,
author="Pavel {Matějka} and Oldřich {Plchot} and Hossein {Zeinali} and Ladislav {Mošner} and Anna {Silnova} and Lukáš {Burget} and Ondřej {Novotný} and Ondřej {Glembek}",
title="Analysis of BUT Submission in Far-Field Scenarios of VOiCES 2019 Challenge",
booktitle="Proceedings of Interspeech",
year="2019",
journal="Proceedings of Interspeech",
volume="2019",
number="9",
pages="2448--2452",
publisher="International Speech Communication Association",
address="Graz",
doi="10.21437/Interspeech.2019-2471",
issn="1990-9772",
url="https://www.isca-speech.org/archive/Interspeech_2019/pdfs/2471.pdf"
}