Detail publikace
Detecting English Speech in the Air Traffic Control Voice Communication
Kesiraju Santosh (UPGM FIT VUT)
Novotný Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Kocour Martin, Ing. (UPGM FIT VUT)
Veselý Karel, Ing., Ph.D. (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
Vývoj aplikací s podporou hlasu v kokpitu vyžaduje skutečné datové sady s popisky a anotacemi. Založili jsme komunitní platformu pro shromažďování řeči z řízení letového provozu (ATC), celosvětově v projektu ATCO2. Filtrování ne anglické řeči je jednou z hlavních složek při zpracování datových kanálů. Navrhovaný systín detekce anglického jazyka (ELD) je založen na embeddingech z bayesovského podprostoru multinomického modelu. Trénuje se na síti zmatení slov z ASR systému. Je robustní, snadno se trénuje a je lehký. Dosáhli jsme 0:0439 stejné míry chyb (EER), 50% relativní snížení ve srovnání s aktuálním stavem v oboru, akustický systém ELD založený na x-vektorech ve scénáři v doméně. Dále jsme dosáhli EER 0:1352, 33% relativní snížení ve srovnání s akustickým ELD v neviditelném jazyce stav (mimo doménu). Hodnocení plánujeme zveřejnit datový soubor z projektu ATCO2.
@INPROCEEDINGS{FITPUB12609, author = "Igor Sz\H{o}ke and Santosh Kesiraju and Ond\v{r}ej Novotn\'{y} and Martin Kocour and Karel Vesel\'{y} and Jan \v{C}ernock\'{y}", title = "Detecting English Speech in the Air Traffic Control Voice Communication", pages = "3286--3290", booktitle = "Proceedings Interspeech 2021", journal = "Proceedings of Interspeech - on-line", volume = 2021, number = 8, year = 2021, location = "Brno, CZ", publisher = "International Speech Communication Association", ISSN = "1990-9772", doi = "10.21437/Interspeech.2021-1033", language = "english", url = "https://www.fit.vut.cz/research/publication/12609" }