Detail publikace
Non-Parametric Bayesian Subspace Models for Acoustic Unit Discovery
Unsupervised learning, non- parametricBayesian models, acoustic unit discovery
Tato práce zkoumá podprostorové neparametrické modely pro úkol naučit sadu akustických jednotek z neoznačených řečových nahrávek. Omezujeme základní míru Dirichletova- Process mixture s fonetickým podprostorem odhadem z jiných zdrojových jazyků za účelem vybudování educated prior, čímž si vynutíme naučení akustických jednotek, aby připomínaly telefony známých zdrojových jazyků. Navrhují se dva typy modelů: (i) podprostor HMM (SHMM), který předpokládá, že fonetický podprostor je stejný pro každý jazyk, (ii) Hierarchický podprostor HMM (H-SHMM) což uvolňuje tento předpoklad a umožňuje mít jazykově specifický podprostor odhadovaný na neoznačených cílových datech. Tyto modely jsou aplikovány na 3 jazyky: angličtina, jorubština a mboshi a jsou porovnávány s různými konkurenčními akustickými jednotkami základní linie objevů. Experimentální výsledky ukazují, že oba podprostor modely předčí ostatní systémy z hlediska kvality shlukování a přesnost segmentace. Navíc pozorujeme, že H-SHMM poskytuje výsledky lepší než SHMM podporující myšlenku, že jazykově specifické priory jsou vhodnější než jazykově agnostické priory pro objev akustické jednotky.
@article{BUT178412,
author="ONDEL YANG, L. and YUSUF, B. and BURGET, L. and SARAÇLAR, M.",
title="Non-Parametric Bayesian Subspace Models for Acoustic Unit Discovery",
journal="IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING",
year="2022",
volume="30",
number="5",
pages="1902--1917",
doi="10.1109/TASLP.2022.3171975",
issn="2329-9290",
url="https://ieeexplore.ieee.org/document/9767690"
}