Detail publikace
Voice activity detection in video mediated communication from gaze
HRADIŠ, M.; EIVAZI, S.; BEDNAŘÍK, R. Voice activity detection in video mediated communication from gaze. ETRA '12 Proceedings of the Symposium on Eye Tracking Research and Applications. Santa Barbara: Association for Computing Machinery, 2012. p. 329-332. ISBN: 978-1-4503-1221-9.
Název česky
Detekce mluvčího z pohledu při videokonferencích
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Klíčová slova
gaze tracking, voice activity detection, speaker recog-nition, machine learning, Support Vector Machines
Abstrakt
Tento článek se zabývá predikcí aktivního mluvčího ve videokonferencích z pohledových dat. Cílem bylo odhadnout aktivitu mluvčích v jedné místnosti na základě záznamů pohledu jednoho účastníka v samostatném pokoji. Tyto dva pohoje byly propojeny kvalitním audio a video spojením. Aktivity zahrnovaly běžný hovor i jednoduché hry. K úloze jsme přistupovali jako ke klasifikačnímu problému. Vyhodnotili jsme různé typy příznaků a různá nastavení parametrů. Výsledky ukazují, že aktivitu mluvčího je možné pomocí tohoto přístupu odhadnout v 90 % času, pro který jsou k dispozici pohledová data.
Rok
2012
Strany
329–332
Sborník
ETRA '12 Proceedings of the Symposium on Eye Tracking Research and Applications
ISBN
978-1-4503-1221-9
Vydavatel
Association for Computing Machinery
Místo
Santa Barbara
DOI
BibTeX
@inproceedings{BUT91461,
author="Michal {Hradiš} and Shahram {Eivazi} and Roman {Bednařík}",
title="Voice activity detection in video mediated communication from gaze",
booktitle="ETRA '12 Proceedings of the Symposium on Eye Tracking Research and Applications",
year="2012",
pages="329--332",
publisher="Association for Computing Machinery",
address="Santa Barbara",
doi="10.1145/2168556.2168628",
isbn="978-1-4503-1221-9",
url="https://www.fit.vut.cz/research/publication/9861/"
}