Detail publikace
Speaker recognition on mono-channel telephony recordings
Cohen Noa
Rohdin Johan Andréas, M.Sc., Ph.D. (UPGM)
Madikeri Srikanth (FIT)
Černocký Jan, prof. Dr. Ing. (UPGM)
rozpoznávání řečníka, telefonní záznamy
Konverzace uložené jako mono data jsou běžným problémem mnoho aplikací pro rozpoznávání řečníků v reálném světě. V tomto článku se zaměřujeme na vyšetřovací scénáře, kde je řada pro řečníka, kterého zajímají, jsou k dispozici mono telefonní rozhovory. Například lidský operátor to mohl ověřit řečník je v těchto rozhovorech přítomen. Nabízíme několik přístupy pro automatické vytváření registračních modelů pro mluvčího zájmu z takových údajů. Poté využíváme registraci modely pro vyhledávání vzhledů mluvčího, který vás zajímá v jiných hovorech. Analyzujeme výkon různých metoda na dvou datových sadách, které odpovídají našemu scénáři, jedna je z a simulovaný případ a jeden je ze skutečného případu.
@inproceedings{BUT179690,
author="Yosef {Solewicz} and Noa {Cohen} and Johan Andréas {Rohdin} and Srikanth {Madikeri} and Jan {Černocký}",
title="Speaker recognition on mono-channel telephony recordings",
booktitle="Proceedings of Odyssey 2022",
year="2022",
pages="193--199",
publisher="International Speech Communication Association",
address="Beijing",
doi="10.21437/Odyssey.2022-27",
url="https://www.isca-speech.org/archive/pdfs/odyssey_2022/solewicz22_odyssey.pdf"
}