Detail publikace
Analysis of Speaker Recognition Systems in Realistic Scenarios of the SITW 2016 Challenge
Matějka Pavel, Ing., Ph.D. (UPGM)
Plchot Oldřich, Ing., Ph.D. (UPGM)
Glembek Ondřej, Ing., Ph.D.
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
speaker recognition, SRE systems, diarization
V tomto příspěvku shrnujeme naše úsilí týkající se výzvy Speakers In The Wild (SITW) a prezentujeme naše poznatky s tímto novým souborem dat pro rozpoznávání mluvčích. Kromě standardního srovnání různých systémů SRE analyzujeme použití diarizace pro práci se zvukovými segmenty obsahujícími více reproduktorů, protože v rámci nově zavedených registračních a testovacích protokolů je diarizace nezbytnou součástí systému. Naše nejmodernější systémy použité v této práci využívají jak cepstrální, tak DNN úzké hrdlo a jsou založeny na i-vektorech následovaných klasifikátorem Pravděpodobnostní lineární diskriminační analýzy (PLDA) a kalibrací / fúzí logistické regrese. Představujeme úzkopásmové (8 kHz) i širokopásmové (16 kHz) systémy společně s jejich fúzí.
@inproceedings{BUT132599,
author="Ondřej {Novotný} and Pavel {Matějka} and Oldřich {Plchot} and Ondřej {Glembek} and Lukáš {Burget} and Jan {Černocký}",
title="Analysis of Speaker Recognition Systems in Realistic Scenarios of the SITW 2016 Challenge",
booktitle="Proceedings of Interspeech 2016",
year="2016",
pages="828--832",
publisher="International Speech Communication Association",
address="San Francisco",
doi="10.21437/Interspeech.2016-981",
isbn="978-1-5108-3313-5",
url="https://www.researchgate.net/publication/307889224_Analysis_of_Speaker_Recognition_Systems_in_Realistic_Scenarios_of_the_SITW_2016_Challenge"
}