Detail publikace

Text-dependent speaker verification based on i-vectors, Neural Networks and Hidden Markov Models

ZEINALI, H.; SAMETI, H.; BURGET, L.; ČERNOCKÝ, J. Text-dependent speaker verification based on i-vectors, Neural Networks and Hidden Markov Models. COMPUTER SPEECH AND LANGUAGE, 2017, vol. 2017, no. 46, p. 53-71. ISSN: 0885-2308.
Název česky
Ověřování mluvčího závislé na textu založené na i-vektorech, neuronových sítích a skrytých Markovových modelech
Typ
článek v časopise
Jazyk
anglicky
Autoři
URL
Klíčová slova

Deep Neural Network; Text-dependent; Speaker verification; i-Vector; Frame alignment; Bottleneck features

Abstrakt

Inspirováni úspěchem Deep Neural Networks (DNN) v rozpoznávání řečníků nezávislých na textu jsme nedávno prokázali, že podobné myšlenky lze aplikovat také na ověřovací úlohu řečníka závislého na textu. V tomto článku popisujeme nové pokroky v našem nejmodernějším přístupu založeném na i-vektorech k verifikaci řečníka závislého na textu, který také využívá různé techniky DNN. Aby bylo možné shromáždit dostatečné statistiky pro extrakci i-vektorů, porovnávají se různé modely zarovnání rámců, jako jsou GMM, phonemic HMM nebo DNN trénované pro klasifikaci senonu. Rovněž experimentujeme s funkcemi úzkých míst založenými na DNN a jejich kombinacemi se standardními funkcemi MFCC. Experimentujeme s několika různými konfiguracemi DNN a zkoumáme důležitost tréninku DNN na 16kHz řeči. Výsledky jsou uvedeny v datové sadě RSR2015, kde je k dispozici školicí materiál pro všechny možné registrační a testovací fráze. Kromě toho vykazujeme výsledky také u náročnějších datových sad RedDots, kde je systém postaven skutečně nezávisle na frázi.

Rok
2017
Strany
53–71
Časopis
COMPUTER SPEECH AND LANGUAGE, roč. 2017, č. 46, ISSN 0885-2308
DOI
UT WoS
000407609600003
EID Scopus
BibTeX
@article{BUT144474,
  author="Hossein {Zeinali} and Hossein {Sameti} and Lukáš {Burget} and Jan {Černocký}",
  title="Text-dependent speaker verification based on i-vectors, Neural Networks and Hidden Markov Models",
  journal="COMPUTER SPEECH AND LANGUAGE",
  year="2017",
  volume="2017",
  number="46",
  pages="53--71",
  doi="10.1016/j.csl.2017.04.005",
  issn="0885-2308",
  url="http://www.sciencedirect.com/science/article/pii/S0885230816303199"
}
Nahoru