Detail publikace
Towards Automatic Methods to Detect Errors in Transcriptions of Speech Recordings
Ondel Yang Lucas Antoine Francois, Mgr., Ph.D. (UPGM FIT VUT)
Manohar Vimal (JHU)
Heřmanský Hynek, prof. Ing., Dr.Eng. (JHU)
Tato práce zkoumá různé metody detekce chyb při přepisech záznamů řeči. Uměle jsme narušili dobře přepsané transkripce řeči třemi typy chyb: substituce, vložení a vymazání fonematických transkripcí TIMIT a transkripce slov WSJ. Nejprve použijeme Bayesovský model výběru metody porovnáním log-pravděpodobnosti z zarovnání a rozpoznávání telefonu, výsledné skóre se vypočítá pro rozhodnutí. V této metodě uvažujeme dva modely, Bayesovský skrytý Markovův model (HMM) a Variational Auto-Encoder (VAE) kombinovaný s HMM. Alternativně vytváříme zkreslený systém ASR s jazykovými modely vyškolenými na jednotlivé transkripce, rozhodnutí o detekci je založeno na vzdálenosti Levenshtein (LD) mezi transkripcí a věšteckou cestou od dekódované mřížky. Vyhodnocujeme metody detekce chyb v poškozené transkripci TIMIT, nejlepší výsledek (buď pomocí výběru modelu u modelu VAE nebo zkreslené ASR) dosahuje 7% stejnou chybovost na křivce Detection Error Tradeoff (DET); Vyhodnocujeme také metody detekce chyb v poškozených transkripcích WSJ a nejlepší výsledek (pomocí zkreslené ASR) dosahuje stejnou chybovost 3%.
@INPROCEEDINGS{FITPUB12099, author = "Jinyi Yang and Francois Antoine Lucas Yang Ondel and Vimal Manohar and Hynek He\v{r}mansk\'{y}", title = "Towards Automatic Methods to Detect Errors in Transcriptions of Speech Recordings", pages = "3747--3751", booktitle = "Proceedings of ICASSP", year = 2019, location = "Brighton, GB", publisher = "IEEE Signal Processing Society", ISBN = "978-1-5386-4658-8", doi = "10.1109/ICASSP.2019.8683722", language = "english", url = "https://www.fit.vut.cz/research/publication/12099" }