Detail publikace
But System for the Second Dihard Speech Diarization Challenge
Wang Shuai
Diez Sánchez Mireia, M.Sc., Ph.D. (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Matějka Pavel, Ing., Ph.D. (UPGM)
Žmolíková Kateřina, Ing., Ph.D. (FIT)
Mošner Ladislav, Ing. (UPGM)
Silnova Anna, M.Sc., Ph.D. (UPGM)
Plchot Oldřich, Ing., Ph.D. (UPGM)
Novotný Ondřej, Ing., Ph.D.
Zeinali Hossein, Ph.D. (UPGM)
Rohdin Johan Andréas, M.Sc., Ph.D. (UPGM)
Speaker Diarization, Variational Bayes, HMM, DIHARD, CHiME
Tento článek popisuje vítězné systémy vyvinuté společností VUT v Brně pro čtyři běhy druhé soutěže DIHARD v diarizaci řeči. Pro běhy 1 a 2 byly systémy založeny hlavně na základě provádění aglomeračního hierarchického seskupování (AHC) x-vektorů, následovány dalším x-vektorem shlukování založené na Bayesově skrytém Markovově modelu a variační Inferenci Bayes. Poskytujeme srovnání zlepšení dané každým krokem a sdílíme implementaci jádra systému. Pro běhy 3 a 4 s nahrávkami z páté soutěže CHIME jsme prozkoumali různé přístupy k provádění vícekanálové diarizace a náš nejlepší výkon byl dosažen při aplikaci AHC na fúze pravděpodobnostního lineárního diskriminačního prvku na kanál skóre analýzy.
@inproceedings{BUT163962,
author="Federico Nicolás {Landini} and Shuai {Wang} and Mireia {Diez Sánchez} and Lukáš {Burget} and Pavel {Matějka} and Kateřina {Žmolíková} and Ladislav {Mošner} and Anna {Silnova} and Oldřich {Plchot} and Ondřej {Novotný} and Hossein {Zeinali} and Johan Andréas {Rohdin}",
title="But System for the Second Dihard Speech Diarization Challenge",
booktitle="ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings",
year="2020",
pages="6529--6533",
publisher="IEEE Signal Processing Society",
address="Barcelona",
doi="10.1109/ICASSP40776.2020.9054251",
isbn="978-1-5090-6631-5",
url="https://ieeexplore.ieee.org/document/9054251"
}