Detail publikace

Automatic Processing Pipeline for Collecting and Annotating Air-Traffic Voice Communication Data

KOCOUR, M.; VESELÝ, K.; SZŐKE, I.; KESIRAJU, S.; ZULUAGA-GOMEZ, J.; BLATT, A.; PRASAD, A.; NIGMATULINA, I.; MOTLÍČEK, P.; KLAKOW, D.; TART, A.; KOLČÁREK, P.; ČERNOCKÝ, J.; CEVENINI, C.; CHOUKRI, K.; RIGAULT, M.; LANDIS, F.; SARFJOO, S. Automatic Processing Pipeline for Collecting and Annotating Air-Traffic Voice Communication Data. In Proceedings of 9th OpenSky Symposium 2021, OpenSky Network, Brussels, Belgium. Proceedings. Brussels: MDPI, 2021. p. 1-10. ISSN: 2504-3900.
Název česky
Řetězec automatického zpracování pro sběr a anotaci řečových dat komunikace v řízení letového provozu
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Kocour Martin, Ing. (UPGM)
Veselý Karel, Ing., Ph.D. (UPGM)
Szőke Igor, Ing., Ph.D. (UPGM)
Kesiraju Santosh, Ph.D. (UPGM)
ZULUAGA-GOMEZ, J.
BLATT, A.
Prasad Amrutha (UPGM)
NIGMATULINA, I.
Motlíček Petr, doc. Ing., Ph.D. (UPGM)
KLAKOW, D.
TART, A.
KOLČÁREK, P.
Černocký Jan, prof. Dr. Ing. (UPGM)
CEVENINI, C.
CHOUKRI, K.
RIGAULT, M.
LANDIS, F.
SARFJOO, S.
a další
URL
Klíčová slova

automatické rozpoznávání řeči; kontrola letového provozu; kontextová adaptace; identifikace jazyka; rozpoznávání pojmenované entity; opensky síť

Abstrakt

Tento dokument popisuje naši pipeline pro automatické zpracování pilotní audio komunikace ATCO, kterou jsme vyvinuli v rámci projektu ATCO2. Dosud jsme shromáždili dva tisíce hodin zvukových nahrávek, které jsme buď předzpracovali pro přepisovatele, nebo je použili pro polořízená trénování. Oba způsoby použití shromážděných dat mohou dále zlepšit naši pipeline přeškolením našich modelů. Navrhovaný kanál automatického zpracování je kaskáda mnoha samostatných komponent: (a) segmentace, (b) ovládání hlasitosti, (c) filtrování poměru signálu k šumu, (d) diarizace, (e) modul řeči na text (ASR). , (f) detekce anglického jazyka, (g) rozpoznávání kódu volací značky, (h) klasifikace ATCOpilota a (i) zvýraznění příkazů a hodnot. Klíčovou součástí pipeline je systém přepisu řeči do textu, který musí být trénován s reálnými daty ATC; jinak je výkon slabý. Abychom dále zlepšili výkon řeči na text, aplikujeme jak polořízené trénování s našimi nahrávkami, tak kontextovou adaptaci, která jako pomocnou informaci používá seznam věrohodných volacích značek z dat sledování. Následné úlohy NLP/NLU jsou důležité z hlediska aplikace. Tyto aplikační úlohy vyžadují přesné modely fungující nad skutečným převodem řeči na text; proto je také potřeba více dat. Vytváření dat ATC je hlavním cílem projektu ATCO2. Na konci projektu budou data zabalena a distribuována společností ELDA.

Rok
2021
Strany
1–10
Časopis
Proceedings, roč. 2021, č. 12, ISSN 2504-3900
Sborník
Proceedings of 9th OpenSky Symposium 2021, OpenSky Network, Brussels, Belgium
Konference
The 9th OpenSky Symposium, EUROCONTROL in Brussels, Belgium, BE
Vydavatel
MDPI
Místo
Brussels
DOI
EID Scopus
BibTeX
@inproceedings{BUT176487,
  author="KOCOUR, M. and VESELÝ, K. and SZŐKE, I. and KESIRAJU, S. and ZULUAGA-GOMEZ, J. and BLATT, A. and PRASAD, A. and NIGMATULINA, I. and MOTLÍČEK, P. and KLAKOW, D. and TART, A. and KOLČÁREK, P. and ČERNOCKÝ, J. and CEVENINI, C. and CHOUKRI, K. and RIGAULT, M. and LANDIS, F. and SARFJOO, S.",
  title="Automatic Processing Pipeline for Collecting and Annotating Air-Traffic Voice Communication Data",
  booktitle="Proceedings of 9th OpenSky Symposium 2021, OpenSky Network, Brussels, Belgium",
  year="2021",
  journal="Proceedings",
  volume="2021",
  number="12",
  pages="1--10",
  publisher="MDPI",
  address="Brussels",
  doi="10.3390/engproc2021013008",
  issn="2504-3900",
  url="https://www.mdpi.com/2673-4591/13/1/8/htm"
}
Nahoru