Detail publikace
BUT system for DIHARD Speech Diarization Challenge 2018
Landini Federico Nicolás (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Rohdin Johan Andréas, M.Sc., Ph.D. (UPGM)
Silnova Anna, M.Sc., Ph.D. (UPGM)
Žmolíková Kateřina, Ing., Ph.D. (FIT)
Novotný Ondřej, Ing., Ph.D.
Veselý Karel, Ing., Ph.D. (UPGM)
Glembek Ondřej, Ing., Ph.D.
Plchot Oldřich, Ing., Ph.D. (UPGM)
Mošner Ladislav, Ing. (UPGM)
Matějka Pavel, Ing., Ph.D. (UPGM)
Speaker Diarization, Variational Bayes, HMM, i-vector, x-vector, Overlapped speech, DIHARD
Tento příspěvek představuje přístup vyvinutý týmem VUT pro první výzvu DIHARD pro diarizaci řeči, který je založen na našem Bayesian Hidden Markov Modelu s "eigenvoice priors" systémem. Kromě popisu přístupu poskytujeme krátkou analýzu různých technik a metod zpracování dat testovaných na vývojové sadě. Také představíme jednoduchý pokus o detekci překrývající se řeči, který jsme použili pro dosažení čistších modelů mluvčích a opětovné přiřazení překrývající se řeči více mluvčích. Nakonec představíme výsledky získané z hodnotící sady a diskutujeme o zjištěních, která jsme učinili během vývojové fáze, a to pomocí zpětné vazby DIHARD leaderboard.
@inproceedings{BUT155100,
author="Mireia {Diez Sánchez} and Federico Nicolás {Landini} and Lukáš {Burget} and Johan Andréas {Rohdin} and Anna {Silnova} and Kateřina {Žmolíková} and Ondřej {Novotný} and Karel {Veselý} and Ondřej {Glembek} and Oldřich {Plchot} and Ladislav {Mošner} and Pavel {Matějka}",
title="BUT system for DIHARD Speech Diarization Challenge 2018",
booktitle="Proceedings of Interspeech 2018",
year="2018",
journal="Proceedings of Interspeech",
volume="2018",
number="9",
pages="2798--2802",
publisher="International Speech Communication Association",
address="Hyderabad",
doi="10.21437/Interspeech.2018-1749",
issn="1990-9772",
url="https://www.isca-speech.org/archive/Interspeech_2018/abstracts/1749.html"
}