Detail projektu
Multi Modal Meeting Manager
Období řešení: 1. 3. 2002 – 28. 2. 2005
Typ projektu: grant
Kód: IST-2001-34485
speech processing, video processing, information merging, meeting summarization
Cílem projektu M4 "Multimodal meeting manager" je vyvinout systém pro analýzu a záznam živých jednání. Účastníci jednání budou snímáni mikrofony a kamerami. Jejich řeč a gesta budou automaticky rozpoznána a indexována pro snadnou orientaci a hledání v záznamu. Uživatel pak bude moci například položit systému otázku "Kdy mluvil pan X o tématu Y" a systém automaticky vyhledá příslušné sekvence. FIT VUT Brno bude pracovat na nových metodách rozpoznávání specifických částí řeči, které bude nezávislé na jazyku jednání. Dalším úkolem bude určení mluvčího pomocí analýzy gest a jeho sledování otočnou kamerou.
Černocký Jan, prof. Dr. Ing. (UPGM)
Zemčík Pavel, prof. Dr. Ing., dr. h. c. (UPGM)
2005
- MOTLÍČEK, P., BURGET, L., ČERNOCKÝ, J. VISUAL FEATURES FOR MULTIMODAL SPEECH RECOGNITION. In Radioelektronika 2005. Brno: Faculty of Electrical Engineering and Communication BUT, 2005.
p. 187-190. ISBN: 80-214-2904-6. Detail - SZŐKE, I., SCHWARZ, P., BURGET, L., KARAFIÁT, M., ČERNOCKÝ, J. Phoneme based acoustics keyword spotting in informal continuous speech. In Radioelektronika 2005. Brno: Faculty of Electrical Engineering and Communication BUT, 2005.
p. 195-198. ISBN: 80-214-2904-6. Detail
2004
- BURGET, L. Combination of Speech Features Using Smoothed Heteroscedastic Linear Discriminant Analysis. In Proc. 8th International Conference on Spoken Language Processing. Jeju island: Sunjin Printing Co, 2004.
p. 2549-2552. Detail - BURGET, L. Measurement of Complementarity of Recognition Systems. In Proc. Seventh International conference on Text, Speech and Dialogue. Lecture Notes in Artificial Intelligence (LNAI) subseries of LNCS series as Volume 3206. Brno: Springer Verlag, 2004.
p. 283-290. ISBN: 3-540-23049-1. Detail - FOUSEK, P., SVOJANOVSKÝ, P., GRÉZL, F., HEŘMANSKÝ, H. New Nonsense Syllables Database - Analyses and Preliminary ASR Experiments. In Proc. 8th International Conference on Spoken Language Processing. 8th International Conference on Spoken Language Processing. Jeju Island: Sunjin Printing Co, 2004.
p. 348-351. ISSN: 1225-4111. Detail - JENDERKA, P., POTÚČEK, I., SUMEC, S. Meeting recordings at Brno University of Technology. In AMI/PASCAL/IM2/M4 workshop. Martigny: 2004.
p. 1 ( p.) Detail - MOTLÍČEK, P. Visual Feature Extreaction for Phoneme Recognition of Meetings. Brno: Department of Computer Graphics and Multimedia FIT BUT, 2004. Detail
- MOTLÍČEK, P., ČERNOCKÝ, J. Multimodal Phoneme Recognition of Meeting Data. Lecture Notes in Computer Science, 2004, vol. 2004, no. 3206,
p. 379 ( p.) ISSN: 0302-9743. Detail - MOTLÍČEK, P., ČERNOCKÝ, J. Multimodal Phoneme Recognition of Meeting Data. In 7th International Conference, TSD 2004 Brno, Czech Republic, September 2004 Proceedings. Lecture Notes in Computer Science. Brno: Springer Verlag, 2004.
p. 379-384. ISBN: 3-540-23049-1. ISSN: 0302-9743. Detail - SCHWARZ, P., MATĚJKA, P., ČERNOCKÝ, J. Phoneme Recognition from a Long Temporal Context. In poster at JOINT AMI/PASCAL/IM2/M4 Workshop on Multimodal Interaction and Related Machine Learning Algorithms. Martigny: Institute for Perceptual Artificial Intelligence, 2004.
p. 1 (1 s.). Detail - SCHWARZ, P., MATĚJKA, P., ČERNOCKÝ, J. Towards Lower Error Rates in Phoneme Recognition. Lecture Notes in Computer Science, 2004, vol. 2004, no. 3206,
p. 465 ( p.) ISSN: 0302-9743. Detail - SCHWARZ, P., MATĚJKA, P., ČERNOCKÝ, J. Towards Lower Error Rates in Phoneme Recognition. In Proceedings of 7th International Conference Text,Speech and Dialoque 2004. Brno: Springer Verlag, 2004.
p. 465 ( p.) ISBN: 3-540-23049-1. Detail - SUMEC, S. Multi Camera Automatic Video Editing. In Proceedings of ICCVG 2004. Warsaw: Kluwer Verlag, 2004.
p. 935-945. ISBN: 1-4020-1503-8. Detail - ZEMČÍK, P., HEROUT, A., CRHA, L., TUPEC, P., FUČÍK, O. Particle rendering pipeline in DSP and FPGA. In Proceedings of Engineering of Computer-Based Systems. Los Alamitos: IEEE Computer Society, 2004.
p. 361-368. ISBN: 0-7695-2125-8. Detail - ZEMČÍK, P., SUMEC, S., POTÚČEK, I., ŠPANĚL, M., HEROUT, A., PEČIVA, J. Summary of Image/Video Processing for AMI Project in Brno. In Poster at MLMI'04 workshop. Martigny: Institute for Perceptual Artificial Intelligence, 2004.
p. 1 (1 s.). Detail
2003
- BURGET, L., ČERNOCKÝ, J. Recognition of Speech with Non-random Attributes. In 6th International Conference, TSD 2003 České Budějovice, Czech Republic, September 2003 Proceedings. Lecture Notes in Computer Science. České Budějovice: Springer Verlag, 2003.
p. 1 ( p.) ISBN: 3-540-20024-X. ISSN: 0302-9743. Detail - SCHWARZ, P., HEŘMANSKÝ, H., MATĚJKA, P. Použití časové dynamiky k rozpoznávání jazyků z mluvené řeči. In Proceedings of Language Recognition Workshop 2003. NIST Gaithersburg, MD USA: 2003.
s. 56-62. Detail