Detail publikace

Voice activity detection in video mediated communication from gaze

HRADIŠ, M.; EIVAZI, S.; BEDNAŘÍK, R. Voice activity detection in video mediated communication from gaze. ETRA '12 Proceedings of the Symposium on Eye Tracking Research and Applications. Santa Barbara: Association for Computing Machinery, 2012. p. 329-332. ISBN: 978-1-4503-1221-9.
Název česky
Detekce mluvčího z pohledu při videokonferencích
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Hradiš Michal, Ing., Ph.D. (UPGM)
Eivazi Shahram
Bednařík Roman
Klíčová slova

gaze tracking, voice activity detection, speaker recog-nition, machine learning, Support Vector Machines

Abstrakt

Tento článek se zabývá predikcí aktivního mluvčího ve videokonferencích z pohledových dat. Cílem bylo odhadnout aktivitu mluvčích v jedné místnosti na základě záznamů pohledu jednoho účastníka v samostatném pokoji. Tyto dva pohoje byly propojeny kvalitním audio a video spojením. Aktivity zahrnovaly běžný hovor i jednoduché hry. K úloze jsme přistupovali jako ke klasifikačnímu problému. Vyhodnotili jsme různé typy příznaků a různá nastavení parametrů. Výsledky ukazují, že aktivitu mluvčího je možné pomocí tohoto přístupu odhadnout v 90 % času, pro který jsou k dispozici pohledová data.

Rok
2012
Strany
329–332
Sborník
ETRA '12 Proceedings of the Symposium on Eye Tracking Research and Applications
ISBN
978-1-4503-1221-9
Vydavatel
Association for Computing Machinery
Místo
Santa Barbara
DOI
BibTeX
@inproceedings{BUT91461,
  author="Michal {Hradiš} and Shahram {Eivazi} and Roman {Bednařík}",
  title="Voice activity detection in video mediated communication from gaze",
  booktitle="ETRA '12 Proceedings of the Symposium on Eye Tracking Research and Applications",
  year="2012",
  pages="329--332",
  publisher="Association for Computing Machinery",
  address="Santa Barbara",
  doi="10.1145/2168556.2168628",
  isbn="978-1-4503-1221-9",
  url="https://www.fit.vut.cz/research/publication/9861/"
}
Nahoru