Detail publikace

Robust Speech Recognition in Unknown Reverberant and Noisy Conditions

HSIAO, R.; MA, J.; HARTMANN, W.; KARAFIÁT, M.; GRÉZL, F.; BURGET, L.; SZŐKE, I.; ČERNOCKÝ, J.; WATANABE, S.; CHEN, Z.; MALLIDI, S.; HEŘMANSKÝ, H.; TSAKALIDIS, S.; SCHWARTZ, R. Robust Speech Recognition in Unknown Reverberant and Noisy Conditions. In Proceedings of 2015 IEEE Automatic Speech Recognition and Understanding Workshop. Scottsdale, Arizona: IEEE Signal Processing Society, 2015. p. 533-538. ISBN: 978-1-4799-7291-3.
Název česky
Robustní rozpoznávání řeči v neznámých podmínkách s reverberací a šumem
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

ASpIRE challenge, robust speech recognition

Abstrakt

V tomto článku popisujeme naši práci na výzvě ASpIRE (Automatic Speech recognition In Reverberant Environments), jejímž cílem je posoudit robustnost systémů automatického rozpoznávání řeči (ASR). Hlavní charakteristikou výzvy je vývoj vysoce výkonného systému bez přístupu k odpovídajícím tréninkovým a vývojovým datům. Zatímco vyhodnocovací data jsou zaznamenávána mikrofony vzdáleného pole v hlučných a dozvukových místnostech, tréninkovými daty jsou telefonická řeč a blízký rozhovor. Náš přístup k této výzvě zahrnuje vylepšení řeči, metody neuronových sítí a přizpůsobení akustického modelu. Ukazujeme, že tyto techniky mohou úspěšně zmírnit snížení výkonu kvůli hlučnému zvuku a nesouladu dat.

Rok
2015
Strany
533–538
Sborník
Proceedings of 2015 IEEE Automatic Speech Recognition and Understanding Workshop
ISBN
978-1-4799-7291-3
Vydavatel
IEEE Signal Processing Society
Místo
Scottsdale, Arizona
DOI
UT WoS
000380604800076
EID Scopus
BibTeX
@inproceedings{BUT120392,
  author="Roger {Hsiao} and Jeff {Ma} and William {Hartmann} and Martin {Karafiát} and František {Grézl} and Lukáš {Burget} and Igor {Szőke} and Jan {Černocký} and Shinji {Watanabe} and Zhuo {Chen} and Sri Harish {Mallidi} and Hynek {Heřmanský} and Stavros {Tsakalidis} and Richard {Schwartz}",
  title="Robust Speech Recognition in Unknown Reverberant and Noisy Conditions",
  booktitle="Proceedings of 2015 IEEE Automatic Speech Recognition and Understanding Workshop",
  year="2015",
  pages="533--538",
  publisher="IEEE Signal Processing Society",
  address="Scottsdale, Arizona",
  doi="10.1109/ASRU.2015.7404841",
  isbn="978-1-4799-7291-3",
  url="https://www.fit.vut.cz/research/publication/11067/"
}
Nahoru