Detail publikace
Boosting of Contextual Information in ASR for Air-Traffic Call-Sign Recognition
Veselý Karel, Ing., Ph.D. (UPGM)
BLATT, A.
ZULUAGA-GOMEZ, J.
Szőke Igor, Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
KLAKOW, D.
Motlíček Petr, doc. Ing., Ph.D. (UPGM)
Air Traffic Control, Automatic Speech Recognition, Contextual Adaptation, Call-sign Recognition, Call-sign Detection, OpenSky Network
Kontextová adaptace ASR může být pro multiaccent a často hlučný projev řízení letového provozu (ATC) velmi přínosná. Zaměřujeme se na rozpoznávání volacích značek, které lze použít ke sledování konverzací provozovatelů ATC s jednotlivými letouny. Vyvinuly jsme dvoustupňovou strategii posilování, sestávající z HCLG boosting a Lattice boosting. Obě jsou implementovány jako WFST složení a kontextové informace jsou pro každou specifickou promluvu. Při posilování HCLG poskytujeme bodové slevy jednotlivým slovům, zatímco v Lattice zvyšuje skóre slevy jsou dány sekvencím slov. Kontextová data mají původ v dohledové databázi OpenSky Network. Z ní získáváme seznamy volacích značek, u kterých je větší pravděpodobnost, že se objeví v nejlepší hypotéze ASR. To také zlepšuje přesnost modulu NLU, který rozpozná volací značky od nejlepších hypotéz z ASR. V rámci projektu ATCO2 jsme shromáždili liveatc testovací sadu2. Posílení volacích značek vede k absolutnímu zlepšení WER o 4,7 %. a 27,1% absolutní nárůst rozpoznávání volacích značek Přesnost (CSA). Náš nejlepší výsledek 82,9 % CSA je docela dost dobrý, vzhledem k tomu, že data jsou zašuměná, a WER 28,4 % je relativně vysoký. Věříme, že je stále co zlepšovat.
@inproceedings{BUT175845,
author="KOCOUR, M. and VESELÝ, K. and BLATT, A. and ZULUAGA-GOMEZ, J. and SZŐKE, I. and ČERNOCKÝ, J. and KLAKOW, D. and MOTLÍČEK, P.",
title="Boosting of Contextual Information in ASR for Air-Traffic Call-Sign Recognition",
booktitle="Proceedings Interspeech 2021",
year="2021",
journal="Proceedings of Interspeech",
volume="2021",
number="8",
pages="3301--3305",
publisher="International Speech Communication Association",
address="Brno",
doi="10.21437/Interspeech.2021-1619",
issn="1990-9772",
url="https://www.isca-speech.org/archive/interspeech_2021/kocour21_interspeech.html"
}