Detail publikace

Robust Speech Recognition in Unknown Reverberant and Noisy Conditions

HSIAO, R.; MA, J.; HARTMANN, W.; KARAFIÁT, M.; GRÉZL, F.; BURGET, L.; SZŐKE, I.; ČERNOCKÝ, J.; WATANABE, S.; CHEN, Z.; MALLIDI, S.; HEŘMANSKÝ, H.; TSAKALIDIS, S.; SCHWARTZ, R. Robust Speech Recognition in Unknown Reverberant and Noisy Conditions. In Proceedings of 2015 IEEE Automatic Speech Recognition and Understanding Workshop. Scottsdale, Arizona: IEEE Signal Processing Society, 2015. p. 533-538. ISBN: 978-1-4799-7291-3.

Název česky

Robustní rozpoznávání řeči v neznámých podmínkách s reverberací a šumem

Typ

článek ve sborníku konference

Jazyk

anglicky

Autoři

Hsiao Roger (FIT)
Ma Jeff
Hartmann William (FIT)
Karafiát Martin, Ing., Ph.D. (UPGM)
Grézl František, Ing., Ph.D. (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Szőke Igor, Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
Watanabe Shinji (FIT)
Chen Zhuo (FIT)
Mallidi Sri Harish (FIT)
Heřmanský Hynek, prof. Ing. (UPGM)
Tsakalidis Stavros (FIT)
Schwartz Richard (FIT)

URL

http://www.fit.vutbr.cz/research/groups/speech/publi/2015/hsiao_asru2015_0000533.pdf PDF

Klíčová slova

ASpIRE challenge, robust speech recognition

Abstrakt

V tomto článku popisujeme naši práci na výzvě ASpIRE (Automatic Speech recognition In Reverberant Environments), jejímž cílem je posoudit robustnost systémů automatického rozpoznávání řeči (ASR). Hlavní charakteristikou výzvy je vývoj vysoce výkonného systému bez přístupu k odpovídajícím tréninkovým a vývojovým datům. Zatímco vyhodnocovací data jsou zaznamenávána mikrofony vzdáleného pole v hlučných a dozvukových místnostech, tréninkovými daty jsou telefonická řeč a blízký rozhovor. Náš přístup k této výzvě zahrnuje vylepšení řeči, metody neuronových sítí a přizpůsobení akustického modelu. Ukazujeme, že tyto techniky mohou úspěšně zmírnit snížení výkonu kvůli hlučnému zvuku a nesouladu dat.

Rok

2015

Strany

533–538

Sborník

Proceedings of 2015 IEEE Automatic Speech Recognition and Understanding Workshop

ISBN

978-1-4799-7291-3

Vydavatel

IEEE Signal Processing Society

Místo

Scottsdale, Arizona

DOI

10.1109/ASRU.2015.7404841

UT WoS

000380604800076

EID Scopus

2-s2.0-84964470918

BibTeX

@inproceedings{BUT120392,
  author="Roger {Hsiao} and Jeff {Ma} and William {Hartmann} and Martin {Karafiát} and František {Grézl} and Lukáš {Burget} and Igor {Szőke} and Jan {Černocký} and Shinji {Watanabe} and Zhuo {Chen} and Sri Harish {Mallidi} and Hynek {Heřmanský} and Stavros {Tsakalidis} and Richard {Schwartz}",
  title="Robust Speech Recognition in Unknown Reverberant and Noisy Conditions",
  booktitle="Proceedings of 2015 IEEE Automatic Speech Recognition and Understanding Workshop",
  year="2015",
  pages="533--538",
  publisher="IEEE Signal Processing Society",
  address="Scottsdale, Arizona",
  doi="10.1109/ASRU.2015.7404841",
  isbn="978-1-4799-7291-3",
  url="https://www.fit.vut.cz/research/publication/11067/"
}