Detail publikace

Non-Parametric Bayesian Subspace Models for Acoustic Unit Discovery

ONDEL YANG, L.; YUSUF, B.; BURGET, L.; SARAÇLAR, M. Non-Parametric Bayesian Subspace Models for Acoustic Unit Discovery. IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, 2022, vol. 30, no. 5, p. 1902-1917. ISSN: 2329-9290.
Název česky
Neparametrické bayesovské podprostorové modely pro vyhledávání akustických jednotek
Typ
článek v časopise
Jazyk
anglicky
Autoři
ONDEL YANG, L.
Yusuf Bolaji (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
SARAÇLAR, M.
URL
Klíčová slova

Unsupervised learning, non- parametricBayesian models, acoustic unit discovery

Abstrakt

Tato práce zkoumá podprostorové neparametrické modely pro úkol naučit sadu akustických jednotek z neoznačených řečových nahrávek. Omezujeme základní míru Dirichletova- Process mixture s fonetickým podprostorem odhadem z jiných zdrojových jazyků za účelem vybudování educated prior, čímž si vynutíme naučení akustických jednotek, aby připomínaly telefony známých zdrojových jazyků. Navrhují se dva typy modelů: (i) podprostor HMM (SHMM), který předpokládá, že fonetický podprostor je stejný pro každý jazyk, (ii) Hierarchický podprostor HMM (H-SHMM) což uvolňuje tento předpoklad a umožňuje mít jazykově specifický podprostor odhadovaný na neoznačených cílových datech. Tyto modely jsou aplikovány na 3 jazyky: angličtina, jorubština a mboshi a jsou porovnávány s různými konkurenčními akustickými jednotkami základní linie objevů. Experimentální výsledky ukazují, že oba podprostor modely předčí ostatní systémy z hlediska kvality shlukování a přesnost segmentace. Navíc pozorujeme, že H-SHMM poskytuje výsledky lepší než SHMM podporující myšlenku, že jazykově specifické priory jsou vhodnější než jazykově agnostické priory pro objev akustické jednotky.

Rok
2022
Strany
1902–1917
Časopis
IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING, roč. 30, č. 5, ISSN 2329-9290
DOI
UT WoS
000811572000001
EID Scopus
BibTeX
@article{BUT178412,
  author="ONDEL YANG, L. and YUSUF, B. and BURGET, L. and SARAÇLAR, M.",
  title="Non-Parametric Bayesian Subspace Models for Acoustic Unit Discovery",
  journal="IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING",
  year="2022",
  volume="30",
  number="5",
  pages="1902--1917",
  doi="10.1109/TASLP.2022.3171975",
  issn="2329-9290",
  url="https://ieeexplore.ieee.org/document/9767690"
}
Nahoru