Detail publikace

BUT system for DIHARD Speech Diarization Challenge 2018

DIEZ SÁNCHEZ, M.; LANDINI, F.; BURGET, L.; ROHDIN, J.; SILNOVA, A.; ŽMOLÍKOVÁ, K.; NOVOTNÝ, O.; VESELÝ, K.; GLEMBEK, O.; PLCHOT, O.; MOŠNER, L.; MATĚJKA, P. BUT system for DIHARD Speech Diarization Challenge 2018. In Proceedings of Interspeech 2018. Proceedings of Interspeech. Hyderabad: International Speech Communication Association, 2018. p. 2798-2802. ISSN: 1990-9772.
Název česky
VUT systém pro DIHARD Speech Diarization Challenge 2018
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

Speaker Diarization, Variational Bayes, HMM, i-vector, x-vector, Overlapped speech, DIHARD

Abstrakt

Tento příspěvek představuje přístup vyvinutý týmem VUT pro první výzvu DIHARD pro diarizaci řeči, který je založen na našem Bayesian Hidden Markov Modelu s "eigenvoice priors" systémem. Kromě popisu přístupu poskytujeme krátkou analýzu různých technik a metod zpracování dat testovaných na vývojové sadě. Také představíme jednoduchý pokus o detekci překrývající se řeči, který jsme použili pro dosažení čistších modelů mluvčích a opětovné přiřazení překrývající se řeči více mluvčích. Nakonec představíme výsledky získané z hodnotící sady a diskutujeme o zjištěních, která jsme učinili během vývojové fáze, a to pomocí zpětné vazby DIHARD leaderboard.

Rok
2018
Strany
2798–2802
Časopis
Proceedings of Interspeech, roč. 2018, č. 9, ISSN 1990-9772
Sborník
Proceedings of Interspeech 2018
Vydavatel
International Speech Communication Association
Místo
Hyderabad
DOI
UT WoS
000465363900585
EID Scopus
BibTeX
@inproceedings{BUT155100,
  author="Mireia {Diez Sánchez} and Federico Nicolás {Landini} and Lukáš {Burget} and Johan Andréas {Rohdin} and Anna {Silnova} and Kateřina {Žmolíková} and Ondřej {Novotný} and Karel {Veselý} and Ondřej {Glembek} and Oldřich {Plchot} and Ladislav {Mošner} and Pavel {Matějka}",
  title="BUT system for DIHARD Speech Diarization Challenge 2018",
  booktitle="Proceedings of Interspeech 2018",
  year="2018",
  journal="Proceedings of Interspeech",
  volume="2018",
  number="9",
  pages="2798--2802",
  publisher="International Speech Communication Association",
  address="Hyderabad",
  doi="10.21437/Interspeech.2018-1749",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/Interspeech_2018/abstracts/1749.html"
}
Nahoru