Detail publikace

Bayesian Subspace Hidden Markov Model for Acoustic Unit Discovery

ONDEL YANG, L.; VYDANA, H.; BURGET, L.; ČERNOCKÝ, J. Bayesian Subspace Hidden Markov Model for Acoustic Unit Discovery. In Proceedings of Interspeech 2019. Proceedings of Interspeech. Graz: International Speech Communication Association, 2019. p. 261-265. ISSN: 1990-9772.
Název česky
Bayesovský podprostorový skrytý Markovův model pro objevování akustických jednotek
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

Bayesian Inference, Hidden Markov Model, Subspace Model, Variational Bayes, Low-resource languages, Acoustic Unit Discovery

Abstrakt

Tato práce řeší problém učení sady jazykově specifických akustických jednotek z neoznačených záznamů řeči, které jsou dány souborem označených nahrávek z jiných jazyků. Náš přístup lze popsat v následujících dvou krocích: nejprve se model naučí pojem akustických jednotek z označených dat a poté model použije své znalosti k nalezení nových akustických jednotek v cílovém jazyce. Implementujeme tento proces s Bayesian Subspace Hidden Markov Model (SHMM), což je model podobný modelu Subspace Gaussian Mixture (SGMM), kde každé nízkodimenzionální vložení představuje spíše akustickou jednotku než jen stav HMM. Podprostor je proškolen ve 3 jazycích z korpusu GlobalPhone (němčina, polština a španělština) a AU jsou objeveny v korpusu TIMIT. Výsledky měřené ekvivalentní četností chyb telefonů ukazují, že tento přístup výrazně překonává předchozí systémy zjišťování akustických jednotek založené na HMM a je příznivě srovnatelné s Variational Auto Encoder-HMM.

Rok
2019
Strany
261–265
Časopis
Proceedings of Interspeech, roč. 2019, č. 9, ISSN 1990-9772
Sborník
Proceedings of Interspeech 2019
Vydavatel
International Speech Communication Association
Místo
Graz
DOI
UT WoS
000831796400053
EID Scopus
BibTeX
@inproceedings{BUT159991,
  author="Lucas Antoine Francois {Ondel} and Hari Krishna {Vydana} and Lukáš {Burget} and Jan {Černocký}",
  title="Bayesian Subspace Hidden Markov Model for Acoustic Unit Discovery",
  booktitle="Proceedings of Interspeech 2019",
  year="2019",
  journal="Proceedings of Interspeech",
  volume="2019",
  number="9",
  pages="261--265",
  publisher="International Speech Communication Association",
  address="Graz",
  doi="10.21437/Interspeech.2019-2224",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/Interspeech_2019/pdfs/2224.pdf"
}
Nahoru