Detail publikace
BUT/Phonexia Bottleneck Feature Extractor
Matějka Pavel, Ing., Ph.D. (UPGM)
Glembek Ondřej, Ing., Ph.D.
Plchot Oldřich, Ing., Ph.D. (UPGM)
Novotný Ondřej, Ing., Ph.D.
Grézl František, Ing., Ph.D. (UPGM)
Schwarz Petr, Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
bottlneck feature extractor, speech recognition, language recognition
Tento dokument doplňuje veřejné vydání extraktoru funkcí úzkého místa BUT / Phonexia (BN). Počínaje krátkou historií přístupů k extrakci řečových funkcí založených na neuronových sítích (NN) a přístupech založených na BN popisuje strukturu vydaného softwaru. Z toho vyplývá popis tří poskytovaných NN: první dva vyškoleni v americkém anglickém korpusu Fisher s cíli monofonního a vázaného stavu a třetí síť trénována vícejazyčným způsobem v 17 jazycích Babel. NN byli technicky vyškoleni pro klasifikaci akustických jednotek, avšak sítě byly optimalizovány s ohledem na úlohu rozpoznávání jazyků, která je hlavním zaměřením tohoto příspěvku. Přesto stojí za zmínku, že kromě rozpoznávání jazyků lze poskytnutý software použít pro jakýkoli úkol související s řečí. Příspěvek končí komplexním shrnutím výsledků získaných při plnění úkolů NIST 2015 a 2017 Language Recognition Evaluation.
@inproceedings{BUT155076,
author="Anna {Silnova} and Pavel {Matějka} and Ondřej {Glembek} and Oldřich {Plchot} and Ondřej {Novotný} and František {Grézl} and Petr {Schwarz} and Jan {Černocký}",
title="BUT/Phonexia Bottleneck Feature Extractor",
booktitle="Proceedings of Odyssey 2018",
year="2018",
journal="Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland",
volume="2018",
number="6",
pages="283--287",
publisher="International Speech Communication Association",
address="Les Sables d´Olonne",
doi="10.21437/Odyssey.2018-40",
issn="2312-2846",
url="https://www.fit.vut.cz/research/publication/11789/"
}