Detail publikace
BUT Text-Dependent Speaker Verification System for SdSV Challenge 2020
Silnova Anna, M.Sc., Ph.D. (UPGM)
Pulugundla Bhargav, M.Sc.
Rohdin Johan Andréas, M.Sc., Ph.D. (UPGM)
Veselý Karel, Ing., Ph.D. (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Plchot Oldřich, Ing., Ph.D. (UPGM)
Glembek Ondřej, Ing., Ph.D.
Novotný Ondřej, Ing., Ph.D.
Matějka Pavel, Ing., Ph.D. (UPGM)
text-dependent speaker verification, phrasedependent PLDA, phrase recognizer
V tomto článku prezentujeme vítězné podání VUT v Brně do soutěže SdSV Challenge 2020, které se týkalo textově závislého úkolu. Vzhledem k velkému množství tréninkových dat dostupných v této výzvě jsme zkoumali úspěšné techniky z textově nezávislých systémů ve scénáři závislém na textu. Zejména jsme trénovali x-vektor extraktory na souborech dat v doméně i mimo doménu a kombinovali je s i-vektory trénovanými na zřetězených MFCC a bottleneckovými prvky, což se ukázalo být efektivním pro scénář závislý na textu. Navíc jsme navrhli použití frázově závislého backend PLDA pro skórování a jeho kombinaci s jednoduchým rozpoznávačem frází, která přináší až 63% relativní zlepšení našeho vývojového souboru s ohledem na používání standardního PLDA. Nakonec zkombinujeme náš různý i-vektor a systémy založené na x-vektorech pomocí jednoduché lineární logistické regrese fúze na úrovni skóre, která poskytuje 28% relativní zlepšení na hodnotící sadě s ohledem na náš nejlepší singl systém.
@inproceedings{BUT168145,
author="Alicia {Lozano Díez} and Anna {Silnova} and Bhargav {Pulugundla} and Johan Andréas {Rohdin} and Karel {Veselý} and Lukáš {Burget} and Oldřich {Plchot} and Ondřej {Glembek} and Ondřej {Novotný} and Pavel {Matějka}",
title="BUT Text-Dependent Speaker Verification System for SdSV Challenge 2020",
booktitle="Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH",
year="2020",
journal="Proceedings of Interspeech",
volume="2020",
number="10",
pages="761--765",
publisher="International Speech Communication Association",
address="Shanghai",
doi="10.21437/Interspeech.2020-2882",
issn="1990-9772",
url="https://www.isca-speech.org/archive/Interspeech_2020/pdfs/2882.pdf"
}