Detail publikace

Towards Automatic Methods to Detect Errors in Transcriptions of Speech Recordings

YANG, J.; ONDEL YANG, L.; MANOHAR, V.; HEŘMANSKÝ, H. Towards Automatic Methods to Detect Errors in Transcriptions of Speech Recordings. In Proceedings of ICASSP. Brighton: IEEE Signal Processing Society, 2019. p. 3747-3751. ISBN: 978-1-5386-4658-8.
Název česky
K automatickým metodám pro detekci chyb přepisů nahrávek řeči
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Yang Jinyi (FIT)
ONDEL YANG, L.
MANOHAR, V.
Heřmanský Hynek, prof. Ing. (UPGM)
URL
Klíčová slova

Transcription error detection, model selection, HMM-GMM, Variational Auto-Encoder, detection error tradeoff

Abstrakt

Tato práce zkoumá různé metody detekce chyb při přepisech záznamů řeči. Uměle jsme narušili dobře přepsané transkripce řeči třemi typy chyb: substituce, vložení a vymazání fonematických transkripcí TIMIT a transkripce slov WSJ. Nejprve použijeme Bayesovský model výběru metody porovnáním log-pravděpodobnosti z zarovnání a rozpoznávání telefonu, výsledné skóre se vypočítá pro rozhodnutí. V této metodě uvažujeme dva modely, Bayesovský skrytý Markovův model (HMM) a Variational Auto-Encoder (VAE) kombinovaný s HMM. Alternativně vytváříme zkreslený systém ASR s jazykovými modely vyškolenými na jednotlivé transkripce, rozhodnutí o detekci je založeno na vzdálenosti Levenshtein (LD) mezi transkripcí a věšteckou cestou od dekódované mřížky. Vyhodnocujeme metody detekce chyb v poškozené transkripci TIMIT, nejlepší výsledek (buď pomocí výběru modelu u modelu VAE nebo zkreslené ASR) dosahuje 7% stejnou chybovost na křivce Detection Error Tradeoff (DET); Vyhodnocujeme také metody detekce chyb v poškozených transkripcích WSJ a nejlepší výsledek (pomocí zkreslené ASR) dosahuje stejnou chybovost 3%.

Rok
2019
Strany
3747–3751
Sborník
Proceedings of ICASSP
ISBN
978-1-5386-4658-8
Vydavatel
IEEE Signal Processing Society
Místo
Brighton
DOI
UT WoS
000482554003194
EID Scopus
BibTeX
@inproceedings{BUT160007,
  author="YANG, J. and ONDEL YANG, L. and MANOHAR, V. and HEŘMANSKÝ, H.",
  title="Towards Automatic Methods to Detect Errors in Transcriptions of Speech Recordings",
  booktitle="Proceedings of ICASSP",
  year="2019",
  pages="3747--3751",
  publisher="IEEE Signal Processing Society",
  address="Brighton",
  doi="10.1109/ICASSP.2019.8683722",
  isbn="978-1-5386-4658-8",
  url="https://ieeexplore.ieee.org/document/8683722"
}
Nahoru