Detail publikace

Factorization of Discriminatively Trained i-Vector Extractor for Speaker Recognition

NOVOTNÝ, O.; PLCHOT, O.; GLEMBEK, O.; BURGET, L. Factorization of Discriminatively Trained i-Vector Extractor for Speaker Recognition. In Proceedings of Interspeech. Proceedings of Interspeech. Graz: International Speech Communication Association, 2019. p. 4330-4334. ISSN: 1990-9772.

Název česky

Faktorizace diskriminativně trénovaného extraktoru i-vektorů pro rozpoznávání mluvčího

Typ

článek ve sborníku konference

Jazyk

anglicky

Autoři

Novotný Ondřej, Ing., Ph.D.
Plchot Oldřich, Ing., Ph.D. (UPGM)
Glembek Ondřej, Ing., Ph.D.
Burget Lukáš, doc. Ing., Ph.D. (UPGM)

URL

Klíčová slova

SRE

Abstrakt

V této práci pokračujeme v našem výzkumu i-vektorového extraktoru pro ověřování mluvčího (SV) a optimalizujeme jeho architekturu pro rychlé a efektivní diskriminační školení. Byli jsme motivováni výpočetními a paměťovými požadavky způsobenými velkým počtem parametrů původního generativního modelu vektoru. Naším cílem je zachovat sílu původního generativního modelu a současně model zaměřit na extrakci informací souvisejících s mluvčím. Ukazujeme, že je možné reprezentovat standardní generativní i-vektorový extraktor modelem s výrazně méně parametry a získat podobný výkon na SV úlohách. Můžeme dále vylepšit tento kompaktní model diskriminačním tréninkem a získat i-vektory, které vedou k lepšímu výkonu na různých SV benchmarcích představujících různé akustické domény.

Rok

2019

Strany

4330–4334

Časopis

Proceedings of Interspeech, roč. 2019, č. 9, ISSN 1990-9772

Sborník

Proceedings of Interspeech

Vydavatel

International Speech Communication Association

Místo

Graz

DOI

10.21437/Interspeech.2019-1757

UT WoS

000831796404095

EID Scopus

2-s2.0-85074713812

BibTeX

@inproceedings{BUT159998,
  author="Ondřej {Novotný} and Oldřich {Plchot} and Ondřej {Glembek} and Lukáš {Burget}",
  title="Factorization of Discriminatively Trained i-Vector Extractor for Speaker Recognition",
  booktitle="Proceedings of Interspeech",
  year="2019",
  journal="Proceedings of Interspeech",
  volume="2019",
  number="9",
  pages="4330--4334",
  publisher="International Speech Communication Association",
  address="Graz",
  doi="10.21437/Interspeech.2019-1757",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/Interspeech_2019/pdfs/1757.pdf"
}