Detail publikace
Detecting English Speech in the Air Traffic Control Voice Communication
Kesiraju Santosh, Ph.D. (UPGM)
Novotný Ondřej, Ing., Ph.D.
Kocour Martin, Ing. (UPGM)
Veselý Karel, Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
speech recognition, language detection, x-vector extractor, acoustic model, air-traffic communication, data collection, text embeddings, Bayesian methods
Vývoj aplikací s podporou hlasu v kokpitu vyžaduje skutečné datové sady s popisky a anotacemi. Založili jsme komunitní platformu pro shromažďování řeči z řízení letového provozu (ATC), celosvětově v projektu ATCO2. Filtrování ne anglické řeči je jednou z hlavních složek při zpracování datových kanálů. Navrhovaný systín detekce anglického jazyka (ELD) je založen na embeddingech z bayesovského podprostoru multinomického modelu. Trénuje se na síti zmatení slov z ASR systému. Je robustní, snadno se trénuje a je lehký. Dosáhli jsme 0:0439 stejné míry chyb (EER), 50% relativní snížení ve srovnání s aktuálním stavem v oboru, akustický systém ELD založený na x-vektorech ve scénáři v doméně. Dále jsme dosáhli EER 0:1352, 33% relativní snížení ve srovnání s akustickým ELD v neviditelném jazyce stav (mimo doménu). Hodnocení plánujeme zveřejnit datový soubor z projektu ATCO2.
@inproceedings{BUT175844,
author="Igor {Szőke} and Santosh {Kesiraju} and Ondřej {Novotný} and Martin {Kocour} and Karel {Veselý} and Jan {Černocký}",
title="Detecting English Speech in the Air Traffic Control Voice Communication",
booktitle="Proceedings Interspeech 2021",
year="2021",
journal="Proceedings of Interspeech",
volume="2021",
number="8",
pages="3286--3290",
publisher="International Speech Communication Association",
address="Brno",
doi="10.21437/Interspeech.2021-1033",
issn="1990-9772",
url="https://www.isca-speech.org/archive/interspeech_2021/szoke21_interspeech.html"
}