Detail projektu
Speech enhancement front-end for robust automatic speech recognition with large amount of training data
Období řešení: 1. 1. 2021 – 31. 12. 2021
Typ projektu: smluvní výzkum
Objednatel: NTT Corporation
rozpoznávání řeči, odolnost, velký objem dat,
Cílem společného výzkumu je vyvinout technologie parametrizace s obohacováním řeči pro robustní automatické rozpoznávání řeči s velkým objemem trénovacích dat v rámci spolupráce mezi VUT a NTT. Práce je založena na nízkodimenzionálních reprezentacích dat (embeddings) produkovaných neuronovými sítěmi v různých místech řetězce zpracování.
Černocký Jan, prof. Dr. Ing. (UPGM)
Kocour Martin, Ing. (UPGM)
Švec Ján, Ing. (UPGM)
2021
- DELCROIX, M.; ŽMOLÍKOVÁ, K.; OCHIAI, T.; KINOSHITA, K.; NAKATANI, T. Speaker activity driven neural speech extraction. In ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings. Toronto: IEEE Signal Processing Society, 2021.
p. 6099-6103. ISBN: 978-1-7281-7605-5. Detail