Detail publikace
Out-of-Vocabulary Words Detection with Attention and CTC Alignments in an End-to-End ASR System
Vydana Hari Krishna
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
Speech recognition, Out-of-vocabulary, OOV, Attention, CTC, End-to-end
Tato práce zkoumá efektivitu detekce pozic slov mimo slovní zásobu (OOV) v dekódovaném promluvě pomocí vah pozornosti a výstupů CTC na snímek end-to-end systému predikujícího sekvence slov. Ukazujeme, že end-to-end přístup může být efektivní pro úlohu detekce OOV. Ukazuje se, že zarovnání CTC poskytují lepší časové informace o pozicích slov OOV než pozornost, a proto jsou pro daný úkol vhodnější. Zjištěné polohy výskytů OOV jsou využívány pro opakující se úlohu obnovy OOV, ve které jsou pravděpodobnostní reprezentace výslovností detekovaných OOV seskupeny za účelem nalezení opakujících se slov. Ukázalo se, že vylepšené výsledky detekce korelují s lepším výkonem obnovy opakujících se OOV.
@inproceedings{BUT175843,
author="Ekaterina {Egorova} and Hari Krishna {Vydana} and Lukáš {Burget} and Jan {Černocký}",
title="Out-of-Vocabulary Words Detection with Attention and CTC Alignments in an End-to-End ASR System",
booktitle="Proceedings Interspeech 2021",
year="2021",
journal="Proceedings of Interspeech",
volume="2021",
number="8",
pages="2901--2905",
publisher="International Speech Communication Association",
address="Brno",
doi="10.21437/Interspeech.2021-1756",
issn="1990-9772",
url="https://www.isca-speech.org/archive/interspeech_2021/egorova21_interspeech.html"
}