Detail publikace

But System for the Second Dihard Speech Diarization Challenge

LANDINI, F.; WANG, S.; DIEZ SÁNCHEZ, M.; BURGET, L.; MATĚJKA, P.; ŽMOLÍKOVÁ, K.; MOŠNER, L.; SILNOVA, A.; PLCHOT, O.; NOVOTNÝ, O.; ZEINALI, H.; ROHDIN, J. But System for the Second Dihard Speech Diarization Challenge. In ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings. Barcelona: IEEE Signal Processing Society, 2020. p. 6529-6533. ISBN: 978-1-5090-6631-5.
Název česky
Systém VUT pro druhou soutěž DIHARD v diarizaci řeči
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

Speaker Diarization, Variational Bayes, HMM, DIHARD, CHiME

Abstrakt

Tento článek popisuje vítězné systémy vyvinuté společností VUT v Brně pro čtyři běhy druhé soutěže DIHARD v diarizaci řeči. Pro běhy 1 a 2 byly systémy založeny hlavně na základě provádění aglomeračního hierarchického seskupování (AHC) x-vektorů, následovány dalším x-vektorem shlukování založené na Bayesově skrytém Markovově modelu a variační Inferenci Bayes. Poskytujeme srovnání zlepšení dané každým krokem a sdílíme implementaci jádra systému. Pro běhy 3 a 4 s nahrávkami z páté soutěže CHIME jsme prozkoumali různé přístupy k provádění vícekanálové diarizace a náš nejlepší výkon byl dosažen při aplikaci AHC na fúze pravděpodobnostního lineárního diskriminačního prvku na kanál skóre analýzy.

Rok
2020
Strany
6529–6533
Sborník
ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings
ISBN
978-1-5090-6631-5
Vydavatel
IEEE Signal Processing Society
Místo
Barcelona
DOI
UT WoS
000615970406158
EID Scopus
BibTeX
@inproceedings{BUT163962,
  author="Federico Nicolás {Landini} and Shuai {Wang} and Mireia {Diez Sánchez} and Lukáš {Burget} and Pavel {Matějka} and Kateřina {Žmolíková} and Ladislav {Mošner} and Anna {Silnova} and Oldřich {Plchot} and Ondřej {Novotný} and Hossein {Zeinali} and Johan Andréas {Rohdin}",
  title="But System for the Second Dihard Speech Diarization Challenge",
  booktitle="ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings",
  year="2020",
  pages="6529--6533",
  publisher="IEEE Signal Processing Society",
  address="Barcelona",
  doi="10.1109/ICASSP40776.2020.9054251",
  isbn="978-1-5090-6631-5",
  url="https://ieeexplore.ieee.org/document/9054251"
}
Nahoru