Detail publikace

Boosting of Contextual Information in ASR for Air-Traffic Call-Sign Recognition

KOCOUR, M.; VESELÝ, K.; BLATT, A.; ZULUAGA-GOMEZ, J.; SZŐKE, I.; ČERNOCKÝ, J.; KLAKOW, D.; MOTLÍČEK, P. Boosting of Contextual Information in ASR for Air-Traffic Call-Sign Recognition. In Proceedings Interspeech 2021. Proceedings of Interspeech. Brno: International Speech Communication Association, 2021. p. 3301-3305. ISSN: 1990-9772.
Název česky
Zvýrazňování kontextové informace v přepisu řeči pro rozpoznávání volacích znaků v letecké dopravě
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

Air Traffic Control, Automatic Speech Recognition,Contextual Adaptation, Call-sign Recognition, Call-signDetection, OpenSky Network

Abstrakt

Kontextová adaptace ASR může být pro multiaccent a často hlučný projev řízení letového provozu (ATC) velmi přínosná. Zaměřujeme se na rozpoznávání volacích značek, které lze použít ke sledování konverzacíprovozovatelů ATC s jednotlivými letouny. Vyvinuly jsme dvoustupňovou strategii posilování, sestávající z HCLGboosting a Lattice boosting. Obě jsou implementovány jako WFSTsložení a kontextové informace jsou pro každou specifickoupromluvu. Při posilování HCLG poskytujeme bodové slevy jednotlivýmslovům, zatímco v Lattice zvyšuje skóre slevyjsou dány sekvencím slov. Kontextová data mají původ vdohledové databázi OpenSky Network. Z ní získávámeseznamy volacích značek, u kterých je větší pravděpodobnost, že se objevív nejlepší hypotéze ASR. To také zlepšuje přesnostmodulu NLU, který rozpozná volací značky od nejlepšíchhypotéz z ASR.V rámci projektu ATCO2 jsme shromáždili liveatc testovací sadu2.Posílení volacích značek vede k absolutnímu zlepšení WER o 4,7 %.a 27,1% absolutní nárůst rozpoznávání volacích značekPřesnost (CSA). Náš nejlepší výsledek 82,9 % CSA je docela dostdobrý, vzhledem k tomu, že data jsou zašuměná, a WER 28,4 % je relativněvysoký. Věříme, že je stále co zlepšovat.

Rok
2021
Strany
3301–3305
Časopis
Proceedings of Interspeech, roč. 2021, č. 8, ISSN 1990-9772
Sborník
Proceedings Interspeech 2021
Konference
22. mezinárodní ISCA konference o hlasové komunikaci (Interspeech 2021), Brno, CZ
Vydavatel
International Speech Communication Association
Místo
Brno
DOI
UT WoS
000841879503079
EID Scopus
BibTeX
@inproceedings{BUT175845,
  author="KOCOUR, M. and VESELÝ, K. and BLATT, A. and ZULUAGA-GOMEZ, J. and SZŐKE, I. and ČERNOCKÝ, J. and KLAKOW, D. and MOTLÍČEK, P.",
  title="Boosting of Contextual Information in ASR for Air-Traffic Call-Sign Recognition",
  booktitle="Proceedings Interspeech 2021",
  year="2021",
  journal="Proceedings of Interspeech",
  volume="2021",
  number="8",
  pages="3301--3305",
  publisher="International Speech Communication Association",
  address="Brno",
  doi="10.21437/Interspeech.2021-1619",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/interspeech_2021/kocour21_interspeech.html"
}
Soubory
Nahoru