Detail publikace

Analysis of Speaker Recognition Systems in Realistic Scenarios of the SITW 2016 Challenge

NOVOTNÝ, O.; MATĚJKA, P.; PLCHOT, O.; GLEMBEK, O.; BURGET, L.; ČERNOCKÝ, J. Analysis of Speaker Recognition Systems in Realistic Scenarios of the SITW 2016 Challenge. In Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016. p. 828-832. ISBN: 978-1-5108-3313-5.
Název česky
Analýza systémů pro ověřování mluvčího v realistických podmínkách SITW 2016 Challenge
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Novotný Ondřej, Ing., Ph.D.
Matějka Pavel, Ing., Ph.D. (UPGM)
Plchot Oldřich, Ing., Ph.D. (UPGM)
Glembek Ondřej, Ing., Ph.D.
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
URL
Klíčová slova

speaker recognition, SRE systems, diarization

Abstrakt

V tomto příspěvku shrnujeme naše úsilí týkající se výzvy Speakers In The Wild (SITW) a prezentujeme naše poznatky s tímto novým souborem dat pro rozpoznávání mluvčích. Kromě standardního srovnání různých systémů SRE analyzujeme použití diarizace pro práci se zvukovými segmenty obsahujícími více reproduktorů, protože v rámci nově zavedených registračních a testovacích protokolů je diarizace nezbytnou součástí systému. Naše nejmodernější systémy použité v této práci využívají jak cepstrální, tak DNN úzké hrdlo a jsou založeny na i-vektorech následovaných klasifikátorem Pravděpodobnostní lineární diskriminační analýzy (PLDA) a kalibrací / fúzí logistické regrese. Představujeme úzkopásmové (8 kHz) i širokopásmové (16 kHz) systémy společně s jejich fúzí.

Rok
2016
Strany
828–832
Sborník
Proceedings of Interspeech 2016
ISBN
978-1-5108-3313-5
Vydavatel
International Speech Communication Association
Místo
San Francisco
DOI
UT WoS
000409394400173
EID Scopus
BibTeX
@inproceedings{BUT132599,
  author="Ondřej {Novotný} and Pavel {Matějka} and Oldřich {Plchot} and Ondřej {Glembek} and Lukáš {Burget} and Jan {Černocký}",
  title="Analysis of Speaker Recognition Systems in Realistic Scenarios of the SITW 2016 Challenge",
  booktitle="Proceedings of Interspeech 2016",
  year="2016",
  pages="828--832",
  publisher="International Speech Communication Association",
  address="San Francisco",
  doi="10.21437/Interspeech.2016-981",
  isbn="978-1-5108-3313-5",
  url="https://www.researchgate.net/publication/307889224_Analysis_of_Speaker_Recognition_Systems_in_Realistic_Scenarios_of_the_SITW_2016_Challenge"
}
Nahoru