Detail publikace

Sequence Summarizing Neural Networks for Spoken Language Recognition

PEŠÁN, J.; BURGET, L.; ČERNOCKÝ, J. Sequence Summarizing Neural Networks for Spoken Language Recognition. In Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016. p. 3285-3289. ISBN: 978-1-5108-3313-5.
Název česky
Sekvenční sumarizační neuronové sítě pro rozpoznávání mluveného jazyka
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

Sequence Summarizing Neural Network, DNN, i-vectors

Abstrakt

Tento článek zkoumá použití Sequence Summarizing Neural Sítě (SSNN) jako varianta hlubokých neuronových sítí (DNN) pro klasifikaci sekvencí. V této práci je aplikována k rozpoznávání mluveného jazyka. Na rozdíl od jiné klasifikace úkoly při zpracování řeči tam, kde to DNN potřebuje produkují výstup na snímek, jazyk je považován za konstantní během promluvy. Zavádíme souhrnnou komponentu do struktury DNN produkující jednu sadu jazykových posteriorů za promluvu. Výcvik DNN provádí vhodně upravený algoritmus přechodu a sestupu. V našem počáteční experimenty jsou výsledky SSNN porovnány s jediným nejmodernější základní systém založený na i-vektorech s podobným složitost (tj. žádná fúze systému atd.). Za určitých podmínek SSNN jsou schopny poskytovat výkon srovnatelný se základní úrovní Systém. Relativního zlepšení až o 30% se dosáhne s fúze úrovně skóre základní linie a systémů SSNN.

Rok
2016
Strany
3285–3289
Sborník
Proceedings of Interspeech 2016
ISBN
978-1-5108-3313-5
Vydavatel
International Speech Communication Association
Místo
San Francisco
DOI
UT WoS
000409394402038
EID Scopus
BibTeX
@inproceedings{BUT131019,
  author="Jan {Pešán} and Lukáš {Burget} and Jan {Černocký}",
  title="Sequence Summarizing Neural Networks for Spoken Language Recognition",
  booktitle="Proceedings of Interspeech 2016",
  year="2016",
  pages="3285--3289",
  publisher="International Speech Communication Association",
  address="San Francisco",
  doi="10.21437/Interspeech.2016-764",
  isbn="978-1-5108-3313-5",
  url="https://www.researchgate.net/publication/307889421_Sequence_Summarizing_Neural_Networks_for_Spoken_Language_Recognition"
}
Nahoru