Detail publikace
Boosting of Contextual Information in ASR for Air-Traffic Call-Sign Recognition
Veselý Karel, Ing., Ph.D. (UPGM)
BLATT, A.
ZULUAGA-GOMEZ, J.
Szőke Igor, Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
KLAKOW, D.
Motlíček Petr, doc. Ing., Ph.D. (UPGM)
Air Traffic Control, Automatic Speech Recognition,Contextual Adaptation, Call-sign Recognition, Call-signDetection, OpenSky Network
Kontextová adaptace ASR může být pro multiaccent a často hlučný projev řízení letového provozu (ATC) velmi přínosná. Zaměřujeme se na rozpoznávání volacích značek, které lze použít ke sledování konverzacíprovozovatelů ATC s jednotlivými letouny. Vyvinuly jsme dvoustupňovou strategii posilování, sestávající z HCLGboosting a Lattice boosting. Obě jsou implementovány jako WFSTsložení a kontextové informace jsou pro každou specifickoupromluvu. Při posilování HCLG poskytujeme bodové slevy jednotlivýmslovům, zatímco v Lattice zvyšuje skóre slevyjsou dány sekvencím slov. Kontextová data mají původ vdohledové databázi OpenSky Network. Z ní získávámeseznamy volacích značek, u kterých je větší pravděpodobnost, že se objevív nejlepší hypotéze ASR. To také zlepšuje přesnostmodulu NLU, který rozpozná volací značky od nejlepšíchhypotéz z ASR.V rámci projektu ATCO2 jsme shromáždili liveatc testovací sadu2.Posílení volacích značek vede k absolutnímu zlepšení WER o 4,7 %.a 27,1% absolutní nárůst rozpoznávání volacích značekPřesnost (CSA). Náš nejlepší výsledek 82,9 % CSA je docela dostdobrý, vzhledem k tomu, že data jsou zašuměná, a WER 28,4 % je relativněvysoký. Věříme, že je stále co zlepšovat.
@inproceedings{BUT175845,
author="KOCOUR, M. and VESELÝ, K. and BLATT, A. and ZULUAGA-GOMEZ, J. and SZŐKE, I. and ČERNOCKÝ, J. and KLAKOW, D. and MOTLÍČEK, P.",
title="Boosting of Contextual Information in ASR for Air-Traffic Call-Sign Recognition",
booktitle="Proceedings Interspeech 2021",
year="2021",
journal="Proceedings of Interspeech",
volume="2021",
number="8",
pages="3301--3305",
publisher="International Speech Communication Association",
address="Brno",
doi="10.21437/Interspeech.2021-1619",
issn="1990-9772",
url="https://www.isca-speech.org/archive/interspeech_2021/kocour21_interspeech.html"
}