Detail projektu
Kvalitativní posun v automatickém rozpoznávání jazyků s využitím streamovaných audio-médií
Období řešení: 19. 1. 2006 - 19. 7. 2007
Typ projektu: grant
Kód: 162/2005
Agentura: CESNET, zájmové sdružení právnických osob
Program:
zpracování řeči, identifikace jazyka, paralelní výpočty, získávání řečových dat, streaming
Projekt je zaměřen na masivní využití streamovaného audia pro kvalitativní posun v úspěšnosti systémů pro automatickou identifikaci jazyka (language identification - LID). Skupina zpracování řeči na Fakultě informačních technologií VUT v Brně (Speech@FIT), jejíž členové projekt podávají, disponuje state-of-the-art systémem pro LID jazyka založeným na akustickém a fonotaktickém modelování. Pro jeho další zlepšení je nutné získat velká množství jazykově závislých dat. V rámci projektu budou tato data získávána z dostupných streamovaných zdrojů (internetová rádia), on-line ukládána, parametrizována a zpracovávána. Bude vyvíjen software pro paralelní trénování modelů pro LID. Získané modely a algoritmy budou evaluovány v rámci mezinárodních kampaní NIST a ve spolupráci s českými bezpečnostními složkami.
Kašpárek Tomáš, Ing. (CVT FIT VUT) , spoluřešitel
Matějka Pavel, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
Schwarz Petr, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
2008
- PLCHOT Oldřich, HUBEIKA Valiantsina, BURGET Lukáš, SCHWARZ Petr a MATĚJKA Pavel. Acquisition of Telephone Data from Radio Broadcasts with Applications to Language Recognition. In: Proc. 11th International Conference on Text, Speech and Dialogue. Berlin: Springer Verlag, 2008, s. 477-483. ISBN 978-3-540-87390-7. Detail
- BURGET Lukáš, SCHWARZ Petr, MATĚJKA Pavel, HANNEMANN Mirko, RASTROW Ariya, WHITE Christopher, KHUDANPUR Sanjeev, HEŘMANSKÝ Hynek a ČERNOCKÝ Jan. Combination of strongly and weakly constrained recognizers for reliable detection of OOVs. In: Proc. International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Las Vegas: IEEE Signal Processing Society, 2008, s. 4. ISBN 1-4244-1484-9. Detail
2007
- BURGET Lukáš, MATĚJKA Pavel, SCHWARZ Petr, GLEMBEK Ondřej a ČERNOCKÝ Jan. Analysis of feature extraction and channel compensation in GMM speaker recognition system. IEEE Transactions on Audio, Speech, and Language Processing, roč. 15, č. 7, 2007, s. 1979-1986. ISSN 1558-7916. Detail
- SZŐKE Igor, BURGET Lukáš a KARAFIÁT Martin. Combination of Word and Phoneme Approach for Spoken Term Detection. Brno, 2007. Detail
- HUBEIKA Valiantsina, BURGET Lukáš, MATĚJKA Pavel a ČERNOCKÝ Jan. Channel Compensation for Speaker Recognition. Brno, 2007. Detail
- HUBEIKA Valiantsina, SZŐKE Igor, BURGET Lukáš a ČERNOCKÝ Jan. Maximum Likelihood and Maximum Mutual Information Training in Gender and Age Recognition System. In: Proc. 10th International Conference on Text Speech and Dialogue (TSD 2007). Pilsen: Springer Verlag, 2007, s. 1-6. ISBN 978-3-540-74627-0. Detail
- MIKOLOV Tomáš, OPARIN Ilya, GLEMBEK Ondřej, BURGET Lukáš, KARAFIÁT Martin a ČERNOCKÝ Jan. Použití mluvených korpusů ve vývoji systému pro rozpoznávání českých přednášek. Praha: Univerzita Karlova, 2007. Detail
- GRÉZL František, KARAFIÁT Martin, KONTÁR Stanislav a ČERNOCKÝ Jan. Probabilistic and bottle-neck features for LVCSR of meetings. In: Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2007). Hononulu: IEEE Signal Processing Society, 2007, s. 757-760. ISBN 1-4244-0728-1. Detail
- ČERNOCKÝ Jan, SZŐKE Igor, FAPŠO Michal, KARAFIÁT Martin, BURGET Lukáš, KOPECKÝ Jiří, GRÉZL František, SCHWARZ Petr, GLEMBEK Ondřej, OPARIN Ilya, SMRŽ Pavel a MATĚJKA Pavel. Search in speech for public security and defense. In: Proc. IEEE Workshop on Signal Processing Applications for Public Security and Forensics, 2007 (SAFE '07). Washington D.C.: IEEE Signal Processing Society, 2007, s. 1-7. ISBN 1-4244-1226-9. Detail
- FAPŠO Michal. Search in speech records. In: Proc. 13th Conference STUDENT EEICT 2007. Brno: Fakulta elektrotechniky a komunikačních technologií VUT v Brně, 2007, s. 1-3. ISBN 978-80-214-3410-3. Detail
- ČERNOCKÝ Jan, BURGET Lukáš, SCHWARZ Petr, MATĚJKA Pavel, KARAFIÁT Martin, GLEMBEK Ondřej, KOPECKÝ Jiří, SZŐKE Igor, FAPŠO Michal, GRÉZL František, HUBEIKA Valiantsina a OPARIN Ilya. Search in speech, language identification and speaker recognition in Speech@FIT. In: Proc. 17th International Conference Radioelektronika, 2007. Brno: Ústav radioelektroniky FEKT VUT v Brně, 2007, s. 1-6. ISBN 978-80-214-3390-8. Detail
- MATĚJKA Pavel, BURGET Lukáš, SCHWARZ Petr, GLEMBEK Ondřej, KARAFIÁT Martin, GRÉZL František, ČERNOCKÝ Jan, VAN Leeuwen David, BRÜMMER Niko a STRASHEIM Albert. STBU system for the NIST 2006 speaker recognition evaluation. In: Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2007). Honolulu: IEEE Signal Processing Society, 2007, s. 221-224. ISBN 1-4244-0728-1. Detail
- GRÉZL František a ČERNOCKÝ Jan. TRAP-based Techniques for Recognition of Noisy Speech. In: Proc. 10th International Conference on Text Speech and Dialogue (TSD 2007). LNCS. Berlin: Springer Verlag, 2007, s. 270-277. ISBN 978-3-540-74627-0. Detail
2006
- MATĚJKA Pavel, BURGET Lukáš, SCHWARZ Petr a ČERNOCKÝ Jan. Brno University of Technology System for NIST 2005 Language Recognition Evaluation. In: Proceedings of Odyssey 2006: The Speaker and Language Recognition Workshop. San Juan, 2006, s. 57-64. ISBN 1-4244-0472-X. Detail
- BURGET Lukáš, MATĚJKA Pavel a ČERNOCKÝ Jan. Discriminative Training Techniques for Acoustic Language Identification. In: Proceedings of ICASSP 2006. Toulouse, 2006, s. 209-212. Detail
- SCHWARZ Petr, MATĚJKA Pavel a ČERNOCKÝ Jan. Hierarchical structures of neural networks for phoneme recognition. In: Proceedings of ICASSP 2006. Toulouse, 2006, s. 325-328. Detail
- MATĚJKA Pavel, BURGET Lukáš, SCHWARZ Petr a ČERNOCKÝ Jan. NIST Language Recognition Evaluation 2005. In: Proceedings of NIST LRE 2005. Washington DC: National Institute of Standards and Technology, 2006, s. 1-37. Detail
- MATĚJKA Pavel, SCHWARZ Petr, BURGET Lukáš a ČERNOCKÝ Jan. Use of anti-models to furher improve state-of-the-art PRLM language recognition system. In: Proceedings of ICASSP 2006. Toulouse, 2006, s. 197-200. Detail