Detail publikace

Out-of-Vocabulary Words Detection with Attention and CTC Alignments in an End-to-End ASR System

EGOROVA, E.; VYDANA, H.; BURGET, L.; ČERNOCKÝ, J. Out-of-Vocabulary Words Detection with Attention and CTC Alignments in an End-to-End ASR System. In Proceedings Interspeech 2021. Proceedings of Interspeech. Brno: International Speech Communication Association, 2021. p. 2901-2905. ISSN: 1990-9772.
Název česky
Detekce slov mimo slovník pro end-to-end systém rozpoznávání řeči pomocí attention a CTC zarovnání
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Egorova Ekaterina, Ing., Ph.D.
Vydana Hari Krishna
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
URL
Klíčová slova

Speech recognition, Out-of-vocabulary, OOV, Attention, CTC, End-to-end

Abstrakt

Tato práce zkoumá efektivitu detekce pozic slov mimo slovní zásobu (OOV) v dekódovaném promluvě pomocí vah pozornosti a výstupů CTC na snímek end-to-end systému predikujícího sekvence slov. Ukazujeme, že end-to-end přístup může být efektivní pro úlohu detekce OOV. Ukazuje se, že zarovnání CTC poskytují lepší časové informace o pozicích slov OOV než pozornost, a proto jsou pro daný úkol vhodnější. Zjištěné polohy výskytů OOV jsou využívány pro opakující se úlohu obnovy OOV, ve které jsou pravděpodobnostní reprezentace výslovností detekovaných OOV seskupeny za účelem nalezení opakujících se slov. Ukázalo se, že vylepšené výsledky detekce korelují s lepším výkonem obnovy opakujících se OOV.

Rok
2021
Strany
2901–2905
Časopis
Proceedings of Interspeech, roč. 2021, č. 8, ISSN 1990-9772
Sborník
Proceedings Interspeech 2021
Vydavatel
International Speech Communication Association
Místo
Brno
DOI
UT WoS
000841879502201
EID Scopus
BibTeX
@inproceedings{BUT175843,
  author="Ekaterina {Egorova} and Hari Krishna {Vydana} and Lukáš {Burget} and Jan {Černocký}",
  title="Out-of-Vocabulary Words Detection with Attention and CTC Alignments in an End-to-End ASR System",
  booktitle="Proceedings Interspeech 2021",
  year="2021",
  journal="Proceedings of Interspeech",
  volume="2021",
  number="8",
  pages="2901--2905",
  publisher="International Speech Communication Association",
  address="Brno",
  doi="10.21437/Interspeech.2021-1756",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/interspeech_2021/egorova21_interspeech.html"
}
Nahoru