Detail projektu
Kvalitativní posun v automatickém rozpoznávání jazyků s využitím streamovaných audio-médií
Období řešení: 19. 1. 2006 – 19. 7. 2007
Typ projektu: grant
Kód: 162/2005
zpracování řeči, identifikace jazyka, paralelní výpočty, získávání řečových dat, streaming
Projekt je zaměřen na masivní využití streamovaného audia pro kvalitativní posun v úspěšnosti systémů pro automatickou identifikaci jazyka (language identification - LID). Skupina zpracování řeči na Fakultě informačních technologií VUT v Brně (Speech@FIT), jejíž členové projekt podávají, disponuje state-of-the-art systémem pro LID jazyka založeným na akustickém a fonotaktickém modelování. Pro jeho další zlepšení je nutné získat velká množství jazykově závislých dat. V rámci projektu budou tato data získávána z dostupných streamovaných zdrojů (internetová rádia), on-line ukládána, parametrizována a zpracovávána. Bude vyvíjen software pro paralelní trénování modelů pro LID. Získané modely a algoritmy budou evaluovány v rámci mezinárodních kampaní NIST a ve spolupráci s českými bezpečnostními složkami.
Kašpárek Tomáš, Ing. (CVT)
Matějka Pavel, Ing., Ph.D. (UPGM)
Schwarz Petr, Ing., Ph.D. (UPGM)