Detail produktu

SW3 ASR pro akusticky náročná prostředí

Vznik: 2023

Název anglicky
SW3 ASR for demanding acoustic conditions
Typ
software
Licence
Výsledek je využíván vlastníkem
Licenční poplatek
Poskytovatel licence na výsledek nepožaduje licenční poplatek
Autoři
Šmíd Luboš, Ing., Ph.D.
Karafiát Martin, Ing., Ph.D. (UPGM)
Švec Jan, Ing., Ph.D.
Lehečka Jan
Mošner Ladislav, Ing. (UPGM)
Brukner Jan, Ing. (UPGM)
Klíčová slova

ASR; rozpoznávání řeči; docker

Popis

Systém pro rozpoznávání řeči (ASR) asijského jazyka založený na moderních přístupech pro trénování. WAV2VEC model byl natrénován na obecných nahrávkách a dotrénován na vietnamských nahrávkách, které byly dále rozšířeny o množení (augmentace) dat pro náročné akustické podmínky. Tímto bylo dosaženo žádané robustnosti. Součástí výsledku je model na odstranění šumu z nahrávky. Výsledkem je aplikace využívající "Docker" kontejner a spustitelná z příkazové řádky (command line) na standardní distribuci Linuxu nebo Windows.

Umístění
Licenční podmínky

Pro informace o licenčních podmínkách prosím kontaktujte: Ing. Martina Kocmanová, Výzkumné centrum informačních technologií, Fakulta informačních technologií VUT v Brně, Božetěchova 2, 612 66 Brno, tel. 541 141 466.

Podpora

Podpořeno z projektu Ministerstva vnitra České republiky Robustní zpracování nahrávek pro operativu a bezpečnost (ROZKAZ), č. VJ01010108 [img]

Projekty
Robustní zpracování nahrávek pro operativu a bezpečnost, MV, PROGRAM STRATEGICKÁ PODPORA ROZVOJE BEZPEČNOSTNÍHO VÝZKUMU ČR 2019-2025 (IMPAKT 1) PODPROGRAMU 1 SPOLEČNÉ VÝZKUMNÉ PROJEKTY (BV IMP1/1VS), VJ01010108, 2020-2025, řešení
Výzkumné skupiny
Pracoviště
Nahoru