Detail publikace
Factorization of Discriminatively Trained i-Vector Extractor for Speaker Recognition
Plchot Oldřich, Ing., Ph.D. (UPGM)
Glembek Ondřej, Ing., Ph.D.
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
SRE
V této práci pokračujeme v našem výzkumu i-vektorového extraktoru pro ověřování mluvčího (SV) a optimalizujeme jeho architekturu pro rychlé a efektivní diskriminační školení. Byli jsme motivováni výpočetními a paměťovými požadavky způsobenými velkým počtem parametrů původního generativního modelu vektoru. Naším cílem je zachovat sílu původního generativního modelu a současně model zaměřit na extrakci informací souvisejících s mluvčím. Ukazujeme, že je možné reprezentovat standardní generativní i-vektorový extraktor modelem s výrazně méně parametry a získat podobný výkon na SV úlohách. Můžeme dále vylepšit tento kompaktní model diskriminačním tréninkem a získat i-vektory, které vedou k lepšímu výkonu na různých SV benchmarcích představujících různé akustické domény.
@inproceedings{BUT159998,
author="Ondřej {Novotný} and Oldřich {Plchot} and Ondřej {Glembek} and Lukáš {Burget}",
title="Factorization of Discriminatively Trained i-Vector Extractor for Speaker Recognition",
booktitle="Proceedings of Interspeech",
year="2019",
journal="Proceedings of Interspeech",
volume="2019",
number="9",
pages="4330--4334",
publisher="International Speech Communication Association",
address="Graz",
doi="10.21437/Interspeech.2019-1757",
issn="1990-9772",
url="https://www.isca-speech.org/archive/Interspeech_2019/pdfs/1757.pdf"
}