Detail publikace

BUT Text-Dependent Speaker Verification System for SdSV Challenge 2020

LOZANO DÍEZ, A.; SILNOVA, A.; PULUGUNDLA, B.; ROHDIN, J.; VESELÝ, K.; BURGET, L.; PLCHOT, O.; GLEMBEK, O.; NOVOTNÝ, O.; MATĚJKA, P. BUT Text-Dependent Speaker Verification System for SdSV Challenge 2020. In Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. Proceedings of Interspeech. Shanghai: International Speech Communication Association, 2020. p. 761-765. ISSN: 1990-9772.
Název česky
Systém VUT pro ověřování mluvčího závislý na textu pro SdSV Challenge 2020
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Lozano Díez Alicia, Ph.D.
Silnova Anna, M.Sc., Ph.D. (UPGM)
Pulugundla Bhargav, M.Sc.
Rohdin Johan Andréas, M.Sc., Ph.D. (UPGM)
Veselý Karel, Ing., Ph.D. (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Plchot Oldřich, Ing., Ph.D. (UPGM)
Glembek Ondřej, Ing., Ph.D.
Novotný Ondřej, Ing., Ph.D.
Matějka Pavel, Ing., Ph.D. (UPGM)
URL
Klíčová slova

text-dependent speaker verification, phrasedependent PLDA, phrase recognizer

Abstrakt

V tomto článku prezentujeme vítězné podání VUT v Brně do soutěže SdSV Challenge 2020, které se týkalo textově závislého úkolu. Vzhledem k velkému množství tréninkových dat dostupných v této výzvě jsme zkoumali úspěšné techniky z textově nezávislých systémů ve scénáři závislém na textu. Zejména jsme trénovali x-vektor extraktory na souborech dat v doméně i mimo doménu a kombinovali je s i-vektory trénovanými na zřetězených MFCC a bottleneckovými prvky, což se ukázalo být efektivním pro scénář závislý na textu. Navíc jsme navrhli použití frázově závislého backend PLDA pro skórování a jeho kombinaci s jednoduchým rozpoznávačem frází, která přináší až 63% relativní zlepšení našeho vývojového souboru s ohledem na používání standardního PLDA. Nakonec zkombinujeme náš různý i-vektor a systémy založené na x-vektorech pomocí jednoduché lineární logistické regrese fúze na úrovni skóre, která poskytuje 28% relativní zlepšení na hodnotící sadě s ohledem na náš nejlepší singl systém.

Rok
2020
Strany
761–765
Časopis
Proceedings of Interspeech, roč. 2020, č. 10, ISSN 1990-9772
Sborník
Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH
Vydavatel
International Speech Communication Association
Místo
Shanghai
DOI
UT WoS
000833594100158
EID Scopus
BibTeX
@inproceedings{BUT168145,
  author="Alicia {Lozano Díez} and Anna {Silnova} and Bhargav {Pulugundla} and Johan Andréas {Rohdin} and Karel {Veselý} and Lukáš {Burget} and Oldřich {Plchot} and Ondřej {Glembek} and Ondřej {Novotný} and Pavel {Matějka}",
  title="BUT Text-Dependent Speaker Verification System for SdSV Challenge 2020",
  booktitle="Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH",
  year="2020",
  journal="Proceedings of Interspeech",
  volume="2020",
  number="10",
  pages="761--765",
  publisher="International Speech Communication Association",
  address="Shanghai",
  doi="10.21437/Interspeech.2020-2882",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/Interspeech_2020/pdfs/2882.pdf"
}
Nahoru