Detail publikace
Bayesian Subspace Hidden Markov Model for Acoustic Unit Discovery
Vydana Hari Krishna
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
Bayesian Inference, Hidden Markov Model, Subspace Model, Variational Bayes, Low-resource languages, Acoustic Unit Discovery
Tato práce řeší problém učení sady jazykově specifických akustických jednotek z neoznačených záznamů řeči, které jsou dány souborem označených nahrávek z jiných jazyků. Náš přístup lze popsat v následujících dvou krocích: nejprve se model naučí pojem akustických jednotek z označených dat a poté model použije své znalosti k nalezení nových akustických jednotek v cílovém jazyce. Implementujeme tento proces s Bayesian Subspace Hidden Markov Model (SHMM), což je model podobný modelu Subspace Gaussian Mixture (SGMM), kde každé nízkodimenzionální vložení představuje spíše akustickou jednotku než jen stav HMM. Podprostor je proškolen ve 3 jazycích z korpusu GlobalPhone (němčina, polština a španělština) a AU jsou objeveny v korpusu TIMIT. Výsledky měřené ekvivalentní četností chyb telefonů ukazují, že tento přístup výrazně překonává předchozí systémy zjišťování akustických jednotek založené na HMM a je příznivě srovnatelné s Variational Auto Encoder-HMM.
@inproceedings{BUT159991,
author="Lucas Antoine Francois {Ondel} and Hari Krishna {Vydana} and Lukáš {Burget} and Jan {Černocký}",
title="Bayesian Subspace Hidden Markov Model for Acoustic Unit Discovery",
booktitle="Proceedings of Interspeech 2019",
year="2019",
journal="Proceedings of Interspeech",
volume="2019",
number="9",
pages="261--265",
publisher="International Speech Communication Association",
address="Graz",
doi="10.21437/Interspeech.2019-2224",
issn="1990-9772",
url="https://www.isca-speech.org/archive/Interspeech_2019/pdfs/2224.pdf"
}