Detail publikace

Speaker recognition on mono-channel telephony recordings

SOLEWICZ, Y.; COHEN, N.; ROHDIN, J.; MADIKERI, S.; ČERNOCKÝ, J. Speaker recognition on mono-channel telephony recordings. Proceedings of Odyssey 2022. Beijing: International Speech Communication Association, 2022. p. 193-199.
Název česky
Rozpoznávání mluvčího v jednokanálových telefonních nahrávkách
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

rozpoznávání řečníka, telefonní záznamy

Abstrakt

Konverzace uložené jako mono data jsou běžným problémem mnoho aplikací pro rozpoznávání řečníků v reálném světě. V tomto článku se zaměřujeme na vyšetřovací scénáře, kde je řada pro řečníka, kterého zajímají, jsou k dispozici mono telefonní rozhovory. Například lidský operátor to mohl ověřit řečník je v těchto rozhovorech přítomen. Nabízíme několik přístupy pro automatické vytváření registračních modelů pro mluvčího zájmu z takových údajů. Poté využíváme registraci modely pro vyhledávání vzhledů mluvčího, který vás zajímá v jiných hovorech. Analyzujeme výkon různých metoda na dvou datových sadách, které odpovídají našemu scénáři, jedna je z a simulovaný případ a jeden je ze skutečného případu.

Rok
2022
Strany
193–199
Sborník
Proceedings of Odyssey 2022
Vydavatel
International Speech Communication Association
Místo
Beijing
DOI
BibTeX
@inproceedings{BUT179690,
  author="Yosef {Solewicz} and Noa {Cohen} and Johan Andréas {Rohdin} and Srikanth {Madikeri} and Jan {Černocký}",
  title="Speaker recognition on mono-channel telephony recordings",
  booktitle="Proceedings of Odyssey 2022",
  year="2022",
  pages="193--199",
  publisher="International Speech Communication Association",
  address="Beijing",
  doi="10.21437/Odyssey.2022-27",
  url="https://www.isca-speech.org/archive/pdfs/odyssey_2022/solewicz22_odyssey.pdf"
}
Nahoru