Detail publikace

Discriminatively Re-trained i-Vector Extractor For Speaker Recognition

NOVOTNÝ, O.; PLCHOT, O.; GLEMBEK, O.; BURGET, L.; MATĚJKA, P. Discriminatively Re-trained i-Vector Extractor For Speaker Recognition. In Proceedings of 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP). Brighton: IEEE Signal Processing Society, 2019. p. 6031-6035. ISBN: 978-1-5386-4658-8.
Název česky
Diskriminativně přetrénovaný extraktor i-vektorů pro rozpoznávání mluvčího
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Novotný Ondřej, Ing., Ph.D.
Plchot Oldřich, Ing., Ph.D. (UPGM)
Glembek Ondřej, Ing., Ph.D.
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Matějka Pavel, Ing., Ph.D. (UPGM)
URL
Klíčová slova

i-vectors, i-vector extractor, speaker recogni-tion, speaker verification, discriminative training

Abstrakt

Tento článek pojednává o diskriminativně přetrénovaném extraktoru i-vektorů pro rozpoznávání mluvčího.V této práci se znovu věnujeme diskriminačnímu tréninku komponenty i-vektorového extraktoru v systému standardního ověřování mluvčích (SV). Motivace našeho výzkumu spočívá v robustnosti a stabilitě tohoto velkého generativního modelu, který chceme zachovat, a zaměřit jeho sílu na jakýkoli zamýšlený úkol SV. Ukazujeme, že po generativní inicializaci i-vektorového extraktoru ji můžeme dále zdokonalit diskriminačním tréninkem a získat i-vektory, které vedou k lepšímu výkonu na různých benchmarcích představujících různé akustické domény.

Rok
2019
Strany
6031–6035
Sborník
Proceedings of 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)
ISBN
978-1-5386-4658-8
Vydavatel
IEEE Signal Processing Society
Místo
Brighton
DOI
UT WoS
000482554006052
EID Scopus
BibTeX
@inproceedings{BUT160000,
  author="Ondřej {Novotný} and Oldřich {Plchot} and Ondřej {Glembek} and Lukáš {Burget} and Pavel {Matějka}",
  title="Discriminatively Re-trained i-Vector Extractor For Speaker Recognition",
  booktitle="Proceedings of 2019 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)",
  year="2019",
  pages="6031--6035",
  publisher="IEEE Signal Processing Society",
  address="Brighton",
  doi="10.1109/ICASSP.2019.8682590",
  isbn="978-1-5386-4658-8",
  url="https://ieeexplore.ieee.org/document/8682590"
}
Nahoru