Detail publikace

Detecting English Speech in the Air Traffic Control Voice Communication

SZŐKE, I.; KESIRAJU, S.; NOVOTNÝ, O.; KOCOUR, M.; VESELÝ, K.; ČERNOCKÝ, J. Detecting English Speech in the Air Traffic Control Voice Communication. In Proceedings Interspeech 2021. Proceedings of Interspeech. Brno: International Speech Communication Association, 2021. p. 3286-3290. ISSN: 1990-9772.
Název česky
Detekce anglických promluv v hlasové komunikaci letecké dopravy
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

speech recognition, language detection, x-vector extractor, acoustic model, air-traffic communication, data collection, text embeddings, Bayesian methods

Abstrakt

Vývoj aplikací s podporou hlasu v kokpitu vyžaduje skutečné datové sady s popisky a anotacemi. Založili jsme komunitní platformu pro shromažďování řeči z řízení letového provozu (ATC), celosvětově v projektu ATCO2. Filtrování ne anglické řeči je jednou z hlavních složek při zpracování datových kanálů. Navrhovaný systín detekce anglického jazyka (ELD) je založen na embeddingech z bayesovského podprostoru multinomického modelu. Trénuje se na síti zmatení slov z ASR systému. Je robustní, snadno se trénuje a je lehký. Dosáhli jsme 0:0439 stejné míry chyb (EER), 50% relativní snížení ve srovnání s aktuálním stavem v oboru, akustický systém ELD založený na x-vektorech ve scénáři v doméně. Dále jsme dosáhli EER 0:1352, 33% relativní snížení ve srovnání s akustickým ELD v neviditelném jazyce stav (mimo doménu). Hodnocení plánujeme zveřejnit datový soubor z projektu ATCO2.

Rok
2021
Strany
3286–3290
Časopis
Proceedings of Interspeech, roč. 2021, č. 8, ISSN 1990-9772
Sborník
Proceedings Interspeech 2021
Vydavatel
International Speech Communication Association
Místo
Brno
DOI
UT WoS
000841879503076
EID Scopus
BibTeX
@inproceedings{BUT175844,
  author="Igor {Szőke} and Santosh {Kesiraju} and Ondřej {Novotný} and Martin {Kocour} and Karel {Veselý} and Jan {Černocký}",
  title="Detecting English Speech in the Air Traffic Control Voice Communication",
  booktitle="Proceedings Interspeech 2021",
  year="2021",
  journal="Proceedings of Interspeech",
  volume="2021",
  number="8",
  pages="3286--3290",
  publisher="International Speech Communication Association",
  address="Brno",
  doi="10.21437/Interspeech.2021-1033",
  issn="1990-9772",
  url="https://www.isca-speech.org/archive/interspeech_2021/szoke21_interspeech.html"
}
Nahoru