Detail publikace

Analysis of the BUT Diarization System for Voxconverse Challenge

LANDINI, F.; GLEMBEK, O.; MATĚJKA, P.; ROHDIN, J.; BURGET, L.; DIEZ SÁNCHEZ, M.; SILNOVA, A. Analysis of the BUT Diarization System for Voxconverse Challenge. In ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Toronto, Ontario: IEEE Signal Processing Society, 2021. p. 5819-5823. ISBN: 978-1-7281-7605-5.
Název česky
Analýza diarizačního systému VUT pro VoxConverse Challenge
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

Speaker Diarization, Variational Bayes, HMM, VoxConverse, VoxSRC Challenge

Abstrakt

Tento příspěvek popisuje systém vyvinutý týmem VUT pro čtvrtou stopu VoxCeleb Speaker Recognition Challenge se zaměřením na diarizaci na datové sadě VoxConverse. Systém se skládá z předzpracování signálu, detekce hlasové aktivity, extrakce vložení mluvčího, počátečního aglomerativního hierarchického shlukování s následnou diarizací pomocí Bayesovského skrytého Markovova modelu, kroku seskupení založeného na globálním vložení pro každého mluvčího a překrytí detekce a zpracování řeči. Poskytujeme srovnání pro každý z kroků a sdílíme implementaci nejdůležitějších modulů našeho systému. Náš systém zaznamenal v výzvě druhé místo, pokud jde o primární metriku (míra chyb diarizace) a první podle sekundární metriky (míra chyb Jaccard).

Financováno

Podpořeno z projektu Ministerstva vnitra České republiky Robustní zpracování nahrávek pro operativu a bezpečnost (ROZKAZ), č. VJ01010108 [img]

Rok
2021
Strany
5819–5823
Sborník
ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
ISBN
978-1-7281-7605-5
Vydavatel
IEEE Signal Processing Society
Místo
Toronto, Ontario
DOI
UT WoS
000704288406018
EID Scopus
BibTeX
@inproceedings{BUT175790,
  author="Federico Nicolás {Landini} and Ondřej {Glembek} and Pavel {Matějka} and Johan Andréas {Rohdin} and Lukáš {Burget} and Mireia {Diez Sánchez} and Anna {Silnova}",
  title="Analysis of the BUT Diarization System for Voxconverse Challenge",
  booktitle="ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)",
  year="2021",
  pages="5819--5823",
  publisher="IEEE Signal Processing Society",
  address="Toronto, Ontario",
  doi="10.1109/ICASSP39728.2021.9414315",
  isbn="978-1-7281-7605-5",
  url="https://ieeexplore.ieee.org/document/9414315"
}
Nahoru