Detail publikace
End-to-end DNN based text-independent speaker recognition for long and short utterances
Silnova Anna, M.Sc., Ph.D. (UPGM)
Diez Sánchez Mireia, M.Sc., Ph.D. (UPGM)
Plchot Oldřich, Ing., Ph.D. (UPGM)
Matějka Pavel, Ing., Ph.D. (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Glembek Ondřej, Ing., Ph.D.
Speaker verification, DNN, End-to-end, Text-independent, i-vector, PLDA
Nedávno bylo navrženo několik systémů ověřování koncového mluvčího založených na hlubokých neuronových sítích (DNN). Ukázalo se, že tyto systémy jsou konkurenceschopné jak pro textově závislé úkoly, tak pro textově nezávislé úlohy s krátkými promluvami. U textově nezávislých úkolů s delšími promluvami jsou však systémy typu end-to-end stále lepší než standardní systémy i-vector + PLDA. V této práci představujeme end-to-end systém ověřování mluvčího, který je inicializován tak, aby napodoboval základní linii i-vektor + PLDA. Systém je poté dále trénován od začátku do konce, ale je upraven tak, aby se neodchyloval příliš daleko od počátečního systému. Tímto způsobem snižujeme nadměrné vybavení, které normálně omezuje výkonnost systémů end-to-end. Navrhovaný systém překonává základní linii i-vektor + PLDA na promluvách o dlouhém i krátkém trvání.
@article{BUT158088,
author="Johan Andréas {Rohdin} and Anna {Silnova} and Mireia {Diez Sánchez} and Oldřich {Plchot} and Pavel {Matějka} and Lukáš {Burget} and Ondřej {Glembek}",
title="End-to-end DNN based text-independent speaker recognition for long and short utterances",
journal="COMPUTER SPEECH AND LANGUAGE",
year="2020",
volume="2020",
number="59",
pages="22--35",
doi="10.1016/j.csl.2019.06.002",
issn="0885-2308",
url="https://www.sciencedirect.com/science/article/pii/S0885230818303632"
}