Detail publikace
Speaker recognition on mono-channel telephony recordings
Cohen Noa (MoPS)
Rohdin Johan A., Dr. (UPGM FIT VUT)
Madikeri Srikanth (IDIAP)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)
rozpoznávání řečníka, telefonní záznamy
Konverzace uložené jako mono data jsou běžným problémem mnoho aplikací pro rozpoznávání řečníků v reálném světě. V tomto článku se zaměřujeme na vyšetřovací scénáře, kde je řada pro řečníka, kterého zajímají, jsou k dispozici mono telefonní rozhovory. Například lidský operátor to mohl ověřit řečník je v těchto rozhovorech přítomen. Nabízíme několik přístupy pro automatické vytváření registračních modelů pro mluvčího zájmu z takových údajů. Poté využíváme registraci modely pro vyhledávání vzhledů mluvčího, který vás zajímá v jiných hovorech. Analyzujeme výkon různých metoda na dvou datových sadách, které odpovídají našemu scénáři, jedna je z a simulovaný případ a jeden je ze skutečného případu.
@INPROCEEDINGS{FITPUB12844, author = "Yosef Solewicz and Noa Cohen and A. Johan Rohdin and Srikanth Madikeri and Jan \v{C}ernock\'{y}", title = "Speaker recognition on mono-channel telephony recordings", pages = "193--199", booktitle = "Proceedings of Odyssey 2022", year = 2022, location = "Beijing, CN", publisher = "International Speech Communication Association", doi = "10.21437/Odyssey.2022-27", language = "english", url = "https://www.fit.vut.cz/research/publication/12844" }