Detail výsledku

BUT system for DIHARD Speech Diarization Challenge 2018

DIEZ SÁNCHEZ, M.; LANDINI, F.; BURGET, L.; ROHDIN, J.; SILNOVA, A.; ŽMOLÍKOVÁ, K.; NOVOTNÝ, O.; VESELÝ, K.; GLEMBEK, O.; PLCHOT, O.; MOŠNER, L.; MATĚJKA, P. BUT system for DIHARD Speech Diarization Challenge 2018. In Proceedings of Interspeech 2018. Proceedings of Interspeech. Hyderabad: International Speech Communication Association, 2018. no. 9, p. 2798-2802. ISSN: 1990-9772.
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Diez Sánchez Mireia, M.Sc., Ph.D., UPGM (FIT)
Landini Federico Nicolás, Ph.D., UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Rohdin Johan Andréas, M.Sc., Ph.D., FIT (FIT), UPGM (FIT)
Silnova Anna, M.Sc., Ph.D., UPGM (FIT)
Žmolíková Kateřina, Ing., Ph.D., UPGM (FIT)
Novotný Ondřej, Ing., Ph.D., UPGM (FIT)
Veselý Karel, Ing., Ph.D., UPGM (FIT)
Glembek Ondřej, Ing., Ph.D., UPGM (FIT)
Plchot Oldřich, Ing., Ph.D., UPGM (FIT)
Mošner Ladislav, Ing., UPGM (FIT)
Matějka Pavel, Ing., Ph.D., UPGM (FIT)
Abstrakt

This paper presents the approach developed by the BUT teamfor the first DIHARD speech diarization challenge, which isbased on our Bayesian Hidden Markov Model with eigenvoicepriors system. Besides the description of the approach, we providea brief analysis of different techniques and data processingmethods tested on the development set. We also introducea simple attempt for overlapped speech detection that we usedfor attaining cleaner speaker models and reassigning overlappedspeech to multiple speakers. Finally, we present results obtainedon the evaluation set and discuss findings we made during thedevelopment phase and with the help of the DIHARD leaderboardfeedback.

Klíčová slova

Speaker Diarization, Variational Bayes, HMM,i-vector, x-vector, Overlapped speech, DIHARD

URL
Rok
2018
Strany
2798–2802
Časopis
Proceedings of Interspeech, roč. 2018, č. 9, ISSN 1990-9772
Sborník
Proceedings of Interspeech 2018
Konference
Interspeech Conference
Vydavatel
International Speech Communication Association
Místo
Hyderabad
DOI
UT WoS
000465363900585
EID Scopus
BibTeX
@inproceedings{BUT155100,
  author="Mireia {Diez Sánchez} and Federico Nicolás {Landini} and Lukáš {Burget} and Johan Andréas {Rohdin} and Anna {Silnova} and Kateřina {Žmolíková} and Ondřej {Novotný} and Karel {Veselý} and Ondřej {Glembek} and Oldřich {Plchot} and Ladislav {Mošner} and Pavel {Matějka}",
  title="BUT system for DIHARD Speech Diarization Challenge 2018",
  booktitle="Proceedings of Interspeech 2018",
  year="2018",
  journal="Proceedings of Interspeech",
  volume="2018",
  number="9",
  pages="2798--2802",
  publisher="International Speech Communication Association",
  address="Hyderabad",
  doi="10.21437/Interspeech.2018-1749",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/Interspeech_2018/abstracts/1749.html"
}
Soubory
Projekty
Dolování infoRmAcí z řeči Pořízené vzdÁlenými miKrofony, MV, Bezpečnostní výzkum České republiky 2015-2020, VI20152020025, zahájení: 2015-10-01, ukončení: 2020-09-30, ukončen
IT4Innovations excellence in science, MŠMT, Národní program udržitelnosti II, LQ1602, zahájení: 2016-01-01, ukončení: 2020-12-31, ukončen
Neuronové sítě pro zpracování signálu a dolování informací v řeči - NOSIČI, TAČR, Program na podporu aplikovaného výzkumu ZÉTA, TJ01000208, zahájení: 2018-01-01, ukončení: 2019-12-31, ukončen
Neuronové sítě shrnující sekvence pro rozpoznávání mluvčího, EU, Horizon 2020, 5SA15094, zahájení: 2016-07-01, ukončení: 2019-06-30, ukončen
Robustní diarizace mluvčích pomocí Bayesovské inference a hlubokého učení, EU, Horizon 2020, zahájení: 2017-03-01, ukončení: 2019-02-28, ukončen
Zvýšení spolehlivosti v automatickém rozpoznávání řečníka, GAČR, Juniorské granty, GJ17-23870Y, zahájení: 2017-01-01, ukončení: 2019-12-31, ukončen
Výzkumné skupiny
Pracoviště
Nahoru