Detail publikace

Boosting of Contextual Information in ASR for Air-Traffic Call-Sign Recognition

KOCOUR, M.; VESELÝ, K.; BLATT, A.; ZULUAGA-GOMEZ, J.; SZŐKE, I.; ČERNOCKÝ, J.; KLAKOW, D.; MOTLÍČEK, P. Boosting of Contextual Information in ASR for Air-Traffic Call-Sign Recognition. In Proceedings Interspeech 2021. Proceedings of Interspeech. Brno: International Speech Communication Association, 2021. p. 3301-3305. ISSN: 1990-9772.
Název česky
Zvýrazňování kontextové informace v přepisu řeči pro rozpoznávání volacích znaků v letecké dopravě
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

Air Traffic Control, Automatic Speech Recognition, Contextual Adaptation, Call-sign Recognition, Call-sign Detection, OpenSky Network

Abstrakt

Kontextová adaptace ASR může být pro multiaccent a často hlučný projev řízení letového provozu (ATC) velmi přínosná. Zaměřujeme se na rozpoznávání volacích značek, které lze použít ke sledování konverzací provozovatelů ATC s jednotlivými letouny. Vyvinuly jsme dvoustupňovou strategii posilování, sestávající z HCLG boosting a Lattice boosting. Obě jsou implementovány jako WFST složení a kontextové informace jsou pro každou specifickou promluvu. Při posilování HCLG poskytujeme bodové slevy jednotlivým slovům, zatímco v Lattice zvyšuje skóre slevy jsou dány sekvencím slov. Kontextová data mají původ v dohledové databázi OpenSky Network. Z ní získáváme seznamy volacích značek, u kterých je větší pravděpodobnost, že se objeví v nejlepší hypotéze ASR. To také zlepšuje přesnost modulu NLU, který rozpozná volací značky od nejlepších hypotéz z ASR. V rámci projektu ATCO2 jsme shromáždili liveatc testovací sadu2. Posílení volacích značek vede k absolutnímu zlepšení WER o 4,7 %. a 27,1% absolutní nárůst rozpoznávání volacích značek Přesnost (CSA). Náš nejlepší výsledek 82,9 % CSA je docela dost dobrý, vzhledem k tomu, že data jsou zašuměná, a WER 28,4 % je relativně vysoký. Věříme, že je stále co zlepšovat.

Rok
2021
Strany
3301–3305
Časopis
Proceedings of Interspeech, roč. 2021, č. 8, ISSN 1990-9772
Sborník
Proceedings Interspeech 2021
Vydavatel
International Speech Communication Association
Místo
Brno
DOI
UT WoS
000841879503079
EID Scopus
BibTeX
@inproceedings{BUT175845,
  author="KOCOUR, M. and VESELÝ, K. and BLATT, A. and ZULUAGA-GOMEZ, J. and SZŐKE, I. and ČERNOCKÝ, J. and KLAKOW, D. and MOTLÍČEK, P.",
  title="Boosting of Contextual Information in ASR for Air-Traffic Call-Sign Recognition",
  booktitle="Proceedings Interspeech 2021",
  year="2021",
  journal="Proceedings of Interspeech",
  volume="2021",
  number="8",
  pages="3301--3305",
  publisher="International Speech Communication Association",
  address="Brno",
  doi="10.21437/Interspeech.2021-1619",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/interspeech_2021/kocour21_interspeech.html"
}
Nahoru