Detail projektu
Speech enhancement front-end for robust automatic speech recognition with large amount of training data
Období řešení: 2. 1. 2023 – 31. 1. 2024
Typ projektu: smluvní výzkum
Objednatel: NTT Corporation
Název česky
Parametrizace s obohacováním řeči pro robustní automatické rozpoznávání řeči s velkým objemem trénovacích dat
Typ
smluvní výzkum
Klíčová slova
rozpoznávání řeči, diarizace mluvčího, velký objem dat, robustnost
Abstrakt
Společný výzkum se zaměří na zkoumání a vývoj technik vylepšování řeči a diarizace mluvčího pro systémy automatického rozpoznávání řeči, které jsou trénovány pomocí velkého množství tréninkových dat.
Řešitelé
Diez Sánchez Mireia, M.Sc., Ph.D.
(UPGM)
– hlavní řešitel
Černocký Jan, prof. Dr. Ing. (UPGM)
Pavlus Ján, Ing. (UPGM)
Peng Junyi, Master of Technology, prof. UMK (UPGM)
Švec Ján, Ing. (UPGM)
Černocký Jan, prof. Dr. Ing. (UPGM)
Pavlus Ján, Ing. (UPGM)
Peng Junyi, Master of Technology, prof. UMK (UPGM)
Švec Ján, Ing. (UPGM)
Publikace
2023
- DELCROIX, M.; TAWARA, N.; DIEZ SÁNCHEZ, M.; LANDINI, F.; SILNOVA, A.; OGAWA, A.; NAKATANI, T.; BURGET, L.; ARAKI, S. Multi-Stream Extension of Variational Bayesian HMM Clustering (MS-VBx) for Combined End-to-End and Vector Clustering-based Diarization. In Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. Proceedings of Interspeech. Dublin: International Speech Communication Association, 2023.
p. 3477-3481. ISSN: 1990-9772. Detail