Detail publikace
A Unified Approach for Audio Characterization and its Application to Speaker Recognition
FERRER, L.; BURGET, L.; PLCHOT, O.; SCHEFFER, N. A Unified Approach for Audio Characterization and its Application to Speaker Recognition. Proceedings of Odyssey 2012, The Speaker and Language Recognition Workshop. Singapur: International Speech Communication Association, 2012. p. 317-323. ISBN: 978-981-07-3093-2.
Název česky
Unifikovaný přistup k charakterizaci audio nahrávek a jeho aplikace pro rozpoznávání řečníka
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Ferrer Luciana
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Plchot Oldřich, Ing., Ph.D. (UPGM)
Scheffer Nicolas
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Plchot Oldřich, Ing., Ph.D. (UPGM)
Scheffer Nicolas
URL
Klíčová slova
audio characterization, speaker recognition, i-vector, calibration metadata
Abstrakt
V této práci je navržena technika pro extrakci nízkorozměrného vektoru, ve kterém je zakódována informace o zvolených charakteristikách audio signálu jako je např.: úroveň a typ sumu pozadí, reverberace či přenosový kanál. Experimentálně je ukázáno, že taková informace může být velmi užitečná při kalibraci a kombinaci systému verifikace mluvčího.
Rok
2012
Strany
317–323
Sborník
Proceedings of Odyssey 2012, The Speaker and Language Recognition Workshop
ISBN
978-981-07-3093-2
Vydavatel
International Speech Communication Association
Místo
Singapur
BibTeX
@inproceedings{BUT96992,
author="Luciana {Ferrer} and Lukáš {Burget} and Oldřich {Plchot} and Nicolas {Scheffer}",
title="A Unified Approach for Audio Characterization and its Application to Speaker Recognition",
booktitle="Proceedings of Odyssey 2012, The Speaker and Language Recognition Workshop",
year="2012",
pages="317--323",
publisher="International Speech Communication Association",
address="Singapur",
isbn="978-981-07-3093-2",
url="http://www.fit.vutbr.cz/research/groups/speech/publi/2012/ferrer_odyssey2012_317-323-59.pdf"
}