Detail práce
Implementace jednoduchého rozpoznávače řeči pro Android
Tato práce se zabývá implementací a optimalizací rozpoznávače řeči pod operačním systémem Android. Pokrývá implementaci nahrávání zvukového signálu, následnou extrakci příznaků pomocí Mel bank filtrů a neuronové sítě. Také obsahuje informace o implementaci dynamického dekodéru. Práce se věnuje převážně implementaci v nízkoúrovňových nástrojích jako jsou Android NDK a Renderscript a vyhodnocuje úspěšnost rozpoznávače a jeho paměťové a časové nároky.
rozpoznávání řeči, Android, NDK, Renderscript, neuronové sítě, dekodér, extrakce příznaků
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm "C".
- Podle obrázku 4.4 (str. 29) je doba výpočtu přímo úměrná velikosti slovníku. Je to správně? Je to žádoucí? Co s tím?
- Tabulka 4.1 hodnotí rychlost neuronové sítě, ale věta na samém konci kap. 4.2 naznačuje, že se nejedná o finální použitou neuronovou síť. Jak ta je rychlá?
Jaroš Jiří, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Novák Michal, doc. RNDr., Ph.D. (UMAT FEKT VUT), člen
Orság Filip, Ing., Ph.D. (UITS FIT VUT), člen
Rychlý Marek, RNDr., Ph.D. (UIFS FIT VUT), člen
@bachelorsthesis{FITBT20485, author = "Petr Flaj\v{s}ingr", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Implementace jednoduch\'{e}ho rozpozn\'{a}va\v{c}e \v{r}e\v{c}i pro Android", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2018, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/20485/" }