Detail publikace
Towards Automatic Methods to Detect Errors in Transcriptions of Speech Recordings
Transcription error detection, model selection, HMM-GMM, Variational Auto-Encoder, detection error tradeoff
Tato práce zkoumá různé metody detekce chyb při přepisech záznamů řeči. Uměle jsme narušili dobře přepsané transkripce řeči třemi typy chyb: substituce, vložení a vymazání fonematických transkripcí TIMIT a transkripce slov WSJ. Nejprve použijeme Bayesovský model výběru metody porovnáním log-pravděpodobnosti z zarovnání a rozpoznávání telefonu, výsledné skóre se vypočítá pro rozhodnutí. V této metodě uvažujeme dva modely, Bayesovský skrytý Markovův model (HMM) a Variational Auto-Encoder (VAE) kombinovaný s HMM. Alternativně vytváříme zkreslený systém ASR s jazykovými modely vyškolenými na jednotlivé transkripce, rozhodnutí o detekci je založeno na vzdálenosti Levenshtein (LD) mezi transkripcí a věšteckou cestou od dekódované mřížky. Vyhodnocujeme metody detekce chyb v poškozené transkripci TIMIT, nejlepší výsledek (buď pomocí výběru modelu u modelu VAE nebo zkreslené ASR) dosahuje 7% stejnou chybovost na křivce Detection Error Tradeoff (DET); Vyhodnocujeme také metody detekce chyb v poškozených transkripcích WSJ a nejlepší výsledek (pomocí zkreslené ASR) dosahuje stejnou chybovost 3%.
@inproceedings{BUT160007,
author="YANG, J. and ONDEL YANG, L. and MANOHAR, V. and HEŘMANSKÝ, H.",
title="Towards Automatic Methods to Detect Errors in Transcriptions of Speech Recordings",
booktitle="Proceedings of ICASSP",
year="2019",
pages="3747--3751",
publisher="IEEE Signal Processing Society",
address="Brighton",
doi="10.1109/ICASSP.2019.8683722",
isbn="978-1-5386-4658-8",
url="https://ieeexplore.ieee.org/document/8683722"
}