Detail publikace
BAT System Description for NIST LRE 2015
Matějka Pavel, Ing., Ph.D. (UPGM)
Fér Radek, Ing.
Glembek Ondřej, Ing., Ph.D.
Novotný Ondřej, Ing., Ph.D.
Pešán Jan, Ing. (UPGM)
Veselý Karel, Ing., Ph.D. (UPGM)
Ondel Lucas Antoine Francois, Mgr., Ph.D. (SSDIT)
Karafiát Martin, Ing., Ph.D. (UPGM)
Grézl František, Ing., Ph.D. (UPGM)
Kesiraju Santosh, Ph.D. (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Brummer Johan Nikolaas Langenhoven, Dr.
Swart Albert du Preez
Cumani Sandro, Ph.D.
Mallidi Sri Harish (FIT)
Li Ruizhi
BAT System Description, NIST LRE
V tomto příspěvku shrnujeme naše úsilí v rámci hodnocení NIST Language Recognition (LRE) 2015, které vyústilo ve velmi výkonné systémy. Poskytujeme oba popisy a analýzu systémů, které jsme zahrnuty v našem podání. Začneme podrobným popisem datových sad, které jsme použili pro trénink a vývoj, a následujeme popisem modelů a metod, které byly použity k vytvoření konečných skóre. Patří mezi ně front-end (tj. Detekce hlasové aktivity a extrakce funkcí), back-end (tj. Konečný klasifikátor) a fáze kalibrace a fúze. Kromě technik běžně používaných v terénu (jako jsou i-vektory, funkce DNN bottle-Neck, NN klasifikátory, Gaussian back-endy atd.), Představujeme méně běžné metody, jako je Sequence Summarizing Neural Networks (SSNN) a automatické zjišťování jednotek. Představujeme výkon systémů jak ve stavu Fixed (kde se od účastníků vyžaduje použití pouze předdefinovaných datových sad), tak ve stavu Open (kde mají účastníci povoleno používat jakýkoli veřejně dostupný zdroj) NIST LRE 2015.
@inproceedings{BUT131004,
author="Oldřich {Plchot} and Pavel {Matějka} and Radek {Fér} and Ondřej {Glembek} and Ondřej {Novotný} and Jan {Pešán} and Karel {Veselý} and Lucas Antoine Francois {Ondel} and Martin {Karafiát} and František {Grézl} and Santosh {Kesiraju} and Lukáš {Burget} and Johan Nikolaas Langenhoven {Brummer} and Albert du Preez {Swart} and Sandro {Cumani} and Sri Harish {Mallidi} and Ruizhi {Li}",
title="BAT System Description for NIST LRE 2015",
booktitle="Proceedings of Odyssey 2016, The Speaker and Language Recognition Workshop",
year="2016",
journal="Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland",
volume="2016",
number="06",
pages="166--173",
publisher="International Speech Communication Association",
address="Bilbao",
doi="10.21437/Odyssey.2016-24",
issn="2312-2846",
url="http://www.odyssey2016.org/papers/pdfs_stamped/73.pdf"
}