Detail projektu
Jazykově nezávislá detekce klíčových slov
Období řešení: 1. 1. 2012 - 31. 12. 2014
Typ projektu: grant
Kód: GPP202/12/P567
Agentura: Grantová agentura České republiky
Program: Postdoktorandské granty
detekce klíčových slov, zadání pomocí vzoru, jazykově nezávislý, skryté Markovovy modely, umělá neuronová siť
Projekt je zaměřen na jazykově nezávislé vyhledávání klíčových slov mluvené řeči. Klíčová slova budou zadávána jako vzor (Query-by-Example). Aplikace výsledku projektu umožní vyhledávání v řeči v řrípadech, kde současné přístupy selhávají. Jedná se zejména o nahrávky exotických jazyků (minimální nebo žádné zdroje trénovacích dat) a také nahrávky, kde mluvčí střídají několik jazyků během hovoru. Prvním cílem projektu je definovat evaluační data pro několik jazyků a vyhodnotit úspěšnost současných systémů Query-by-Example ve vícejazyčném prostředí. Hlavní cíle jsou: (1) návrh a testování postupu pro získávání jazykově nezávislých high-level příznaků z řeči. Příznaky budou získávány pomocí kombinace jazykově závislých klasifikátorů založených na umělých neuronových sítích. (2) návrh na testování postupu pro detekci klíčových slov zadaných vzorem pomocí GMM/HMM. Důležitý bude výzkum vhodného odhadu modelu klíčového slova pouze na základě několika příkladů a také odhadu modelu obecné řeči. Dosažené výsledky budou porovnány se standardním jazykově závislým přístupem.
Janda Miloš, Ing. (UPGM FIT VUT) , spoluřešitel
Veselý Karel, Ing., Ph.D. (UPGM FIT VUT) , spoluřešitel
2015
- SZŐKE Igor, SKÁCEL Miroslav, ČERNOCKÝ Jan a BURGET Lukáš. Coping with Channel Mismatch in Query-By-Example - BUT QUESST 2014. In: Proceedings of 2015 IEEE International Conference on Acoustics, Speech and Signal Processing. South Brisbane, Queensland: IEEE Signal Processing Society, 2015, s. 5838-5842. ISBN 978-1-4673-6997-8. Detail
- ANGUERA Xavier, RODRIGUEZ-FUENTES Luis J., BUZO Andi, METZE Florian, SZŐKE Igor a PENAGARIKANO Mikel. QUESST2014: Evaluating Query-By-Example Speech Search in a Zero-Resource Setting with Real-Life Queries. In: Proceedings of 2015 IEEE International Conference on Acoustics, Speech and Signal Processing. South Brisbane, Queensland: IEEE Signal Processing Society, 2015, s. 5833-5837. ISBN 978-1-4673-6997-8. Detail
2014
- SZŐKE Igor, SKÁCEL Miroslav a BURGET Lukáš. BUT QUESST 2014 System Description. In: CEUR Workshop Proceedings. Barcelona: CEUR-WS.org, 2014, s. 1-2. ISSN 1613-0073. Detail
- SZŐKE Igor, BURGET Lukáš, GRÉZL František, ČERNOCKÝ Jan a ONDEL Yang Lucas Antoine Francois. Calibration and Fusion of Query-by-example Systems - BUT SWS 2013. In: Proceedings of ICASSP 2014. Florencie: IEEE Signal Processing Society, 2014, s. 7899-7903. ISBN 978-1-4799-2892-7. Detail
- ANGUERA Xavier, RODRIGUEZ-FUENTES Luis J., SZŐKE Igor, BUZO Andi a METZE Florian. Query by Example Search on Speech at Mediaeval 2014. In: CEUR Workshop Proceedings. Barcelona: CEUR-WS.org, 2014, s. 1-2. ISSN 1613-0073. Detail
- ANGUERA Xavier, RODRIGUEZ-FUENTES Luis J., SZŐKE Igor, BUZO Andi a METZE Florian a kol. Query-by-example Spoken Term Detection Evaluation on Low-resource Languages. In: Proceedings of the 4th International Workshop on Spoken Language Technologies for Under- resourced Languages SLTU-2014. St. Petersburg, Russia. St. Petersburg: International Speech Communication Association, 2014, s. 24-31. ISBN 978-5-8088-0908-6. Detail
2013
- SZŐKE Igor, BURGET Lukáš, GRÉZL František a ONDEL Yang Lucas Antoine Francois. BUT SWS 2013 - Massive Parallel Approach. In: Proceedings of the MediaEval 2013 Multimedia Benchmark Workshop. Barcelona: CEUR-WS.org, 2013, s. 1-2. ISSN 1613-0073. Detail
- ANGUERA Xavier, METZE Florian, BUZO Andi, SZŐKE Igor a RODRIGUEZ-FUENTES Luis J. The Spoken Web Search Task. In: CEUR Workshop Proceedings. Barcelona: CEUR-WS.org, 2013, s. 1-2. ISSN 1613-0073. Detail
2012
- SZŐKE Igor, FAPŠO Michal a VESELÝ Karel. BUT2012 Approaches for Spoken Web Search - MediaEval 2012. In: Working Notes Proceedings of the MediaEval 2012 Workshop. Pisa: CEUR-WS.org, 2012, s. 1-2. ISSN 1613-0073. Detail
- TEJEDOR Javier, FAPŠO Michal, SZŐKE Igor, ČERNOCKÝ Jan a GRÉZL František. Comparison of methods for language-dependent and language-independent query-by-example spoken term detection. ACM Transactions on Information Systems (TOIS), roč. 2012, č. 30, s. 1-34. ISSN 1046-8188. Detail
- SZŐKE Igor, FAPŠO Michal, ŽIŽKA Josef, BERAN Vítězslav a ČERNOCKÝ Jan. Efektivní přístup ke znalostem v audio-vizuálních záznamech. In: Proceedings of the Annual Database Conference. Praha: Technická univerzita v Košiciach, 2012, s. 57-74. ISBN 978-80-553-1049-7. Detail