Detail publikace

Text Augmentation for Language Models in High Error Recognition Scenario

BENEŠ, K.; BURGET, L. Text Augmentation for Language Models in High Error Recognition Scenario. In Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. Proceedings of Interspeech. Brno: International Speech Communication Association, 2021. p. 1872-1876. ISSN: 1990-9772.
Název česky
Augmentace textu pro jazykové modelování ve scénářích s vysokou chybovostí
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

data augmentation, error simulation, language modeling, automatic speech recognition

Abstrakt

V tomto článku prozkoumáme několik strategií augmentace dat pro trénování jazykových modelů pro rozpoznávání řeči. Porovnáváme augmentaci na základě globální statistiky chyb s jednou založenou na unigramové statistice chyb ASR a s vyhlazením štítků a jeho vzorkovanou variantou. Kromě toho zkoumáme stabilitu a prediktivní sílu zmatenosti odhadovanou na rozšířených datech. Navzdory tomu, že je triviální, augmentace řízená globální mírou substituce, delece a vkládání dosahuje nejlepších výsledků. Na druhou stranu, i když je související míra zmatenosti stabilní, neposkytuje lepší předpověď konečné míry chyb než ta vanilková. Naše nejlepší schéma augmentace zvyšuje zlepšení WER z druhého průchodu z 1,1 % na 1,9 % absolutně při výzvě CHiMe-6.

Rok
2021
Strany
1872–1876
Časopis
Proceedings of Interspeech, roč. 2021, č. 8, ISSN 1990-9772
Sborník
Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH
Konference
22ND ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, Brno, CZ
Vydavatel
International Speech Communication Association
Místo
Brno
DOI
UT WoS
000841879501198
EID Scopus
BibTeX
@inproceedings{BUT175841,
  author="Karel {Beneš} and Lukáš {Burget}",
  title="Text Augmentation for Language Models in High Error Recognition Scenario",
  booktitle="Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH",
  year="2021",
  journal="Proceedings of Interspeech",
  volume="2021",
  number="8",
  pages="1872--1876",
  publisher="International Speech Communication Association",
  address="Brno",
  doi="10.21437/Interspeech.2021-627",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/interspeech_2021/benes21_interspeech.html"
}
Nahoru