Detail publikace

Factorization of Discriminatively Trained i-Vector Extractor for Speaker Recognition

NOVOTNÝ, O.; PLCHOT, O.; GLEMBEK, O.; BURGET, L. Factorization of Discriminatively Trained i-Vector Extractor for Speaker Recognition. In Proceedings of Interspeech. Proceedings of Interspeech. Graz: International Speech Communication Association, 2019. p. 4330-4334. ISSN: 1990-9772.
Název česky
Faktorizace diskriminativně trénovaného extraktoru i-vektorů pro rozpoznávání mluvčího
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Novotný Ondřej, Ing., Ph.D.
Plchot Oldřich, Ing., Ph.D. (UPGM)
Glembek Ondřej, Ing., Ph.D.
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
URL
Klíčová slova

SRE

Abstrakt

V této práci pokračujeme v našem výzkumu i-vektorového extraktoru pro ověřování mluvčího (SV) a optimalizujeme jeho architekturu pro rychlé a efektivní diskriminační školení. Byli jsme motivováni výpočetními a paměťovými požadavky způsobenými velkým počtem parametrů původního generativního modelu vektoru. Naším cílem je zachovat sílu původního generativního modelu a současně model zaměřit na extrakci informací souvisejících s mluvčím. Ukazujeme, že je možné reprezentovat standardní generativní i-vektorový extraktor modelem s výrazně méně parametry a získat podobný výkon na SV úlohách. Můžeme dále vylepšit tento kompaktní model diskriminačním tréninkem a získat i-vektory, které vedou k lepšímu výkonu na různých SV benchmarcích představujících různé akustické domény.

Rok
2019
Strany
4330–4334
Časopis
Proceedings of Interspeech, roč. 2019, č. 9, ISSN 1990-9772
Sborník
Proceedings of Interspeech
Vydavatel
International Speech Communication Association
Místo
Graz
DOI
UT WoS
000831796404095
EID Scopus
BibTeX
@inproceedings{BUT159998,
  author="Ondřej {Novotný} and Oldřich {Plchot} and Ondřej {Glembek} and Lukáš {Burget}",
  title="Factorization of Discriminatively Trained i-Vector Extractor for Speaker Recognition",
  booktitle="Proceedings of Interspeech",
  year="2019",
  journal="Proceedings of Interspeech",
  volume="2019",
  number="9",
  pages="4330--4334",
  publisher="International Speech Communication Association",
  address="Graz",
  doi="10.21437/Interspeech.2019-1757",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/Interspeech_2019/pdfs/1757.pdf"
}
Nahoru