Detail publikace
Measuring Speech Recognition And Understanding Performance in Air Traffic Control Domain Beyond Word Error Rates
SHETTY, S.
KLEINERT, M.
OHNEISER, O.
EHR, H.
Motlíček Petr, doc. Ing., Ph.D. (UPGM)
Prasad Amrutha (UPGM)
WINDISCH, C.
a další
chybovost slov, rychlost rozpoznávání příkazů, jazyk porozumění, řízení letového provozu, ATC, nezařazená slovní sazba
Aplikace automatického rozpoznávání řeči (ASR) v oblasti analogové hlasové komunikace mezi řídícími letového provozu (ATCo) a piloty má pro koncové uživatele více požadavků, než jen transformaci mluveného slova do textu. Je k ničemu například pro podporu detekce chyb zpětného čtení, pokud je rozpoznání slov dokonalé, pokud je sémantická interpretace chybná. Pro ATCo není téměř důležité, zda jsou slova pozdravu správně rozpoznána. Špatné rozpoznání pozdravu by však nemělo narušit správné rozpoznání, např. příkazu sestup. Důležitější je správná sémantická interpretace. Jaká je však správná sémantická interpretace, zvláště když se ATCos nebo pilot více či méně odchylují od publikované standardní frazeologie? Pro porovnávání výkonu různých aplikací rozpoznávání řeči se 14 evropských partnerů z oblasti řízení letového provozu (ATM) nedávno dohodlo na společném souboru pravidel, tj. na ontologii, jak anotovat řečové projevy ATCo na sémantické úrovni. Tento dokument nejprve představuje novou metriku neklasifikované rychlosti slov, rozšiřuje ontologii na pilotní výroky a zavádí metriky míry rozpoznání příkazů, chybovosti rozpoznání příkazů a míry odmítnutí rozpoznání příkazů. To umožňuje srovnání různých případů rozpoznávání řeči a porozumění na sémantické úrovni. Implementace použitá v tomto dokumentu dosahuje míry rozpoznání příkazů lepší než 96 % pro Prague Approach, i když je četnost slovních chyb vyšší než 2,5 % na základě více než 12 000 příkazů ATCo zaznamenaných v provozním i laboratorním prostředí. To překonalo předchozí zveřejněné sazby o 2 % absolutně.
@inproceedings{BUT176486,
author="HELMKE, H. and SHETTY, S. and KLEINERT, M. and OHNEISER, O. and EHR, H. and MOTLÍČEK, P. and PRASAD, A. and WINDISCH, C.",
title="Measuring Speech Recognition And Understanding Performance in Air Traffic Control Domain Beyond Word Error Rates",
booktitle="Proceedings of 11th SESAR Innovation Days 2021",
year="2021",
pages="1--8",
address="Belgie",
url="https://www.fit.vut.cz/research/publication/12684/"
}