Detail publikace
Analysis of the BUT Diarization System for Voxconverse Challenge
Glembek Ondřej, Ing., Ph.D.
Matějka Pavel, Ing., Ph.D. (UPGM)
Rohdin Johan Andréas, M.Sc., Ph.D. (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Diez Sánchez Mireia, M.Sc., Ph.D. (UPGM)
Silnova Anna, M.Sc., Ph.D. (UPGM)
Speaker Diarization, Variational Bayes, HMM, VoxConverse, VoxSRC Challenge
Tento příspěvek popisuje systém vyvinutý týmem VUT pro čtvrtou stopu VoxCeleb Speaker Recognition Challenge se zaměřením na diarizaci na datové sadě VoxConverse. Systém se skládá z předzpracování signálu, detekce hlasové aktivity, extrakce vložení mluvčího, počátečního aglomerativního hierarchického shlukování s následnou diarizací pomocí Bayesovského skrytého Markovova modelu, kroku seskupení založeného na globálním vložení pro každého mluvčího a překrytí detekce a zpracování řeči. Poskytujeme srovnání pro každý z kroků a sdílíme implementaci nejdůležitějších modulů našeho systému. Náš systém zaznamenal v výzvě druhé místo, pokud jde o primární metriku (míra chyb diarizace) a první podle sekundární metriky (míra chyb Jaccard).
Podpořeno z projektu Ministerstva vnitra České republiky Robustní zpracování nahrávek pro operativu a bezpečnost (ROZKAZ), č. VJ01010108
@inproceedings{BUT175790,
author="Federico Nicolás {Landini} and Ondřej {Glembek} and Pavel {Matějka} and Johan Andréas {Rohdin} and Lukáš {Burget} and Mireia {Diez Sánchez} and Anna {Silnova}",
title="Analysis of the BUT Diarization System for Voxconverse Challenge",
booktitle="ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)",
year="2021",
pages="5819--5823",
publisher="IEEE Signal Processing Society",
address="Toronto, Ontario",
doi="10.1109/ICASSP39728.2021.9414315",
isbn="978-1-7281-7605-5",
url="https://ieeexplore.ieee.org/document/9414315"
}