Detail publikace

BAT System Description for NIST LRE 2015

PLCHOT, O.; MATĚJKA, P.; FÉR, R.; GLEMBEK, O.; NOVOTNÝ, O.; PEŠÁN, J.; VESELÝ, K.; ONDEL YANG, L.; KARAFIÁT, M.; GRÉZL, F.; KESIRAJU, S.; BURGET, L.; BRUMMER, J.; SWART, A.; CUMANI, S.; MALLIDI, S.; LI, R. BAT System Description for NIST LRE 2015. In Proceedings of Odyssey 2016, The Speaker and Language Recognition Workshop. Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland. Bilbao: International Speech Communication Association, 2016. p. 166-173. ISSN: 2312-2846.
Název česky
Popis BAT systému pro NIST LRE 2015 evaluace
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Plchot Oldřich, Ing., Ph.D. (UPGM)
Matějka Pavel, Ing., Ph.D. (UPGM)
Fér Radek, Ing.
Glembek Ondřej, Ing., Ph.D.
Novotný Ondřej, Ing., Ph.D.
Pešán Jan, Ing. (UPGM)
Veselý Karel, Ing., Ph.D. (UPGM)
Ondel Lucas Antoine Francois, Mgr., Ph.D. (SSDIT)
Karafiát Martin, Ing., Ph.D. (UPGM)
Grézl František, Ing., Ph.D. (UPGM)
Kesiraju Santosh, Ph.D. (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Brummer Johan Nikolaas Langenhoven, Dr.
Swart Albert du Preez
Cumani Sandro, Ph.D.
Mallidi Sri Harish (FIT)
Li Ruizhi
URL
Klíčová slova

BAT System Description,  NIST LRE

Abstrakt

V tomto příspěvku shrnujeme naše úsilí v rámci hodnocení NIST Language Recognition (LRE) 2015, které vyústilo ve velmi výkonné systémy. Poskytujeme oba popisy a analýzu systémů, které jsme zahrnuty v našem podání. Začneme podrobným popisem datových sad, které jsme použili pro trénink a vývoj, a následujeme popisem modelů a metod, které byly použity k vytvoření konečných skóre. Patří mezi ně front-end (tj. Detekce hlasové aktivity a extrakce funkcí), back-end (tj. Konečný klasifikátor) a fáze kalibrace a fúze. Kromě technik běžně používaných v terénu (jako jsou i-vektory, funkce DNN bottle-Neck, NN klasifikátory, Gaussian back-endy atd.), Představujeme méně běžné metody, jako je Sequence Summarizing Neural Networks (SSNN) a automatické zjišťování jednotek. Představujeme výkon systémů jak ve stavu Fixed (kde se od účastníků vyžaduje použití pouze předdefinovaných datových sad), tak ve stavu Open (kde mají účastníci povoleno používat jakýkoli veřejně dostupný zdroj) NIST LRE 2015.

Rok
2016
Strany
166–173
Časopis
Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland, roč. 2016, č. 06, ISSN 2312-2846
Sborník
Proceedings of Odyssey 2016, The Speaker and Language Recognition Workshop
Vydavatel
International Speech Communication Association
Místo
Bilbao
DOI
EID Scopus
BibTeX
@inproceedings{BUT131004,
  author="Oldřich {Plchot} and Pavel {Matějka} and Radek {Fér} and Ondřej {Glembek} and Ondřej {Novotný} and Jan {Pešán} and Karel {Veselý} and Lucas Antoine Francois {Ondel} and Martin {Karafiát} and František {Grézl} and Santosh {Kesiraju} and Lukáš {Burget} and Johan Nikolaas Langenhoven {Brummer} and Albert du Preez {Swart} and Sandro {Cumani} and Sri Harish {Mallidi} and Ruizhi {Li}",
  title="BAT System Description for NIST LRE 2015",
  booktitle="Proceedings of Odyssey 2016, The Speaker and Language Recognition Workshop",
  year="2016",
  journal="Proceedings of Odyssey: The Speaker and Language Recognition Workshop Odyssey 2014, Joensuu, Finland",
  volume="2016",
  number="06",
  pages="166--173",
  publisher="International Speech Communication Association",
  address="Bilbao",
  doi="10.21437/Odyssey.2016-24",
  issn="2312-2846",
  url="http://www.odyssey2016.org/papers/pdfs_stamped/73.pdf"
}
Nahoru