Detail projektu

Multi-lingualita v řečových technologiích

Období řešení: 1. 1. 2020 – 31. 8. 2023

Typ projektu: grant

Kód: LTAIN19087

Agentura: Ministerstvo školství, mládeže a tělovýchovy ČR

Program: INTER-EXCELLENCE - Podprogram INTER-ACTION 19LTAIN

Název anglicky
Multi-linguality in speech technologies
Typ
grant
Klíčová slova

multi-lingualita, rozpoznávání řeči, strojové učení, data, přenos učení

Abstrakt

Technologie dolování řečových dat a rozhraní člověk-stroj založené na řeči zažily v posledním desetiletí významné pokroky a  řada aplikací byla úspěšně komercializována. Obvykle však fungují správně pouze v  příznivých scénářích -v jazycích s množstvím dat pro trénování a v relativně čistém prostředí, jako je kancelář nebo byt. Narychle se rozvíjejících velkých trzích, jako je ten indický, ztěžují využívání řeči závažné problémy: mnoho jazyků (některé z nich s omezenými nebo chybějícími zdroji), velmi hlučné podmínky (spousta obchodů se jednoduše provádí na ulicích indických měst)a variabilní počet mluvčích v konverzaci (od běžných dvou po celé rodiny). Díky tomu je vývoj automatického rozpoznávání řeči (automatic speech recognition, ASR), rozpoznávání mluvčího (speaker recognition, SR) a  diarizace mluvčích (určení, kdo kdy mluvil, speaker diarization, SD) komplikovaný. V  rámci navrhovaného projektu se dvě zavedené akademické laboratoře se zkušenostmi s multilingválním ASR, robustním SR a SD: Vysoké učení technické v Brně (VUT), IIT Madras (IIT-M) spojily s důležitým hráčem na indickém a globálním trhu s elektronikou -Samsung R&D Institute India-Bangalore (SRI-B), a  navrhují významný posun vtěchto technologiích, zejména ve vícejazyčném ASR s  omezenými zdroji. Zatímco VUT a  IIT-M budou poskytovat špičkový výzkum voblasti dolování řeči (založený mimo jiné na amerických programech IARPA Babel and Material, vítězství v evaluaci IARPA ASpIRE a v Interspeech 2018 Low Resource Speech Recognition Challenge for Indian Languages, a na indickém projektu MANDI) , SRI-B bude poskytovat data, průmyslové vedení a bude se věnovat tvorbě demonstrátorů.

Řešitelé
Černocký Jan, prof. Dr. Ing. (UPGM) – hlavní řešitel
Egorova Ekaterina, Ing., Ph.D.
Skácel Miroslav, Ing.
Žižka Josef, Ing. (UPGM)
Publikace

2023

2022

2021

2020

Nahoru