Detail publikace
Robust Speech Recognition in Unknown Reverberant and Noisy Conditions
Ma Jeff
Hartmann William (FIT)
Karafiát Martin, Ing., Ph.D. (UPGM)
Grézl František, Ing., Ph.D. (UPGM)
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Szőke Igor, Ing., Ph.D. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
Watanabe Shinji (FIT)
Chen Zhuo (FIT)
Mallidi Sri Harish (FIT)
Heřmanský Hynek, prof. Ing. (UPGM)
Tsakalidis Stavros (FIT)
Schwartz Richard (FIT)
ASpIRE challenge, robust speech recognition
V tomto článku popisujeme naši práci na výzvě ASpIRE (Automatic Speech recognition In Reverberant Environments), jejímž cílem je posoudit robustnost systémů automatického rozpoznávání řeči (ASR). Hlavní charakteristikou výzvy je vývoj vysoce výkonného systému bez přístupu k odpovídajícím tréninkovým a vývojovým datům. Zatímco vyhodnocovací data jsou zaznamenávána mikrofony vzdáleného pole v hlučných a dozvukových místnostech, tréninkovými daty jsou telefonická řeč a blízký rozhovor. Náš přístup k této výzvě zahrnuje vylepšení řeči, metody neuronových sítí a přizpůsobení akustického modelu. Ukazujeme, že tyto techniky mohou úspěšně zmírnit snížení výkonu kvůli hlučnému zvuku a nesouladu dat.
@inproceedings{BUT120392,
author="Roger {Hsiao} and Jeff {Ma} and William {Hartmann} and Martin {Karafiát} and František {Grézl} and Lukáš {Burget} and Igor {Szőke} and Jan {Černocký} and Shinji {Watanabe} and Zhuo {Chen} and Sri Harish {Mallidi} and Hynek {Heřmanský} and Stavros {Tsakalidis} and Richard {Schwartz}",
title="Robust Speech Recognition in Unknown Reverberant and Noisy Conditions",
booktitle="Proceedings of 2015 IEEE Automatic Speech Recognition and Understanding Workshop",
year="2015",
pages="533--538",
publisher="IEEE Signal Processing Society",
address="Scottsdale, Arizona",
doi="10.1109/ASRU.2015.7404841",
isbn="978-1-4799-7291-3",
url="https://www.fit.vut.cz/research/publication/11067/"
}