Detail publikace
Automatic Processing Pipeline for Collecting and Annotating Air-Traffic Voice Communication Data
Veselý Karel, Ing., Ph.D. (UPGM)
Szőke Igor, Ing., Ph.D. (UPGM)
Kesiraju Santosh, Ph.D. (UPGM)
ZULUAGA-GOMEZ, J.
BLATT, A.
Prasad Amrutha (UPGM)
NIGMATULINA, I.
Motlíček Petr, doc. Ing., Ph.D. (UPGM)
KLAKOW, D.
TART, A.
KOLČÁREK, P.
Černocký Jan, prof. Dr. Ing. (UPGM)
CEVENINI, C.
CHOUKRI, K.
RIGAULT, M.
LANDIS, F.
SARFJOO, S.
a další
automatické rozpoznávání řeči; kontrola letového provozu; kontextová adaptace; identifikace jazyka; rozpoznávání pojmenované entity; opensky síť
Tento dokument popisuje naši pipeline pro automatické zpracování pilotní audio komunikace ATCO, kterou jsme vyvinuli v rámci projektu ATCO2. Dosud jsme shromáždili dva tisíce hodin zvukových nahrávek, které jsme buď předzpracovali pro přepisovatele, nebo je použili pro polořízená trénování. Oba způsoby použití shromážděných dat mohou dále zlepšit naši pipeline přeškolením našich modelů. Navrhovaný kanál automatického zpracování je kaskáda mnoha samostatných komponent: (a) segmentace, (b) ovládání hlasitosti, (c) filtrování poměru signálu k šumu, (d) diarizace, (e) modul řeči na text (ASR). , (f) detekce anglického jazyka, (g) rozpoznávání kódu volací značky, (h) klasifikace ATCOpilota a (i) zvýraznění příkazů a hodnot. Klíčovou součástí pipeline je systém přepisu řeči do textu, který musí být trénován s reálnými daty ATC; jinak je výkon slabý. Abychom dále zlepšili výkon řeči na text, aplikujeme jak polořízené trénování s našimi nahrávkami, tak kontextovou adaptaci, která jako pomocnou informaci používá seznam věrohodných volacích značek z dat sledování. Následné úlohy NLP/NLU jsou důležité z hlediska aplikace. Tyto aplikační úlohy vyžadují přesné modely fungující nad skutečným převodem řeči na text; proto je také potřeba více dat. Vytváření dat ATC je hlavním cílem projektu ATCO2. Na konci projektu budou data zabalena a distribuována společností ELDA.
@inproceedings{BUT176487,
author="KOCOUR, M. and VESELÝ, K. and SZŐKE, I. and KESIRAJU, S. and ZULUAGA-GOMEZ, J. and BLATT, A. and PRASAD, A. and NIGMATULINA, I. and MOTLÍČEK, P. and KLAKOW, D. and TART, A. and KOLČÁREK, P. and ČERNOCKÝ, J. and CEVENINI, C. and CHOUKRI, K. and RIGAULT, M. and LANDIS, F. and SARFJOO, S.",
title="Automatic Processing Pipeline for Collecting and Annotating Air-Traffic Voice Communication Data",
booktitle="Proceedings of 9th OpenSky Symposium 2021, OpenSky Network, Brussels, Belgium",
year="2021",
journal="Proceedings",
volume="2021",
number="12",
pages="1--10",
publisher="MDPI",
address="Brussels",
doi="10.3390/engproc2021013008",
issn="2504-3900",
url="https://www.mdpi.com/2673-4591/13/1/8/htm"
}