Detail publikace

Comprehensive Multiparametric Analysis of Human Deepfake Speech Recognition

MALINKA, K.; FIRC, A.; ŠALKO, M.; PRUDKÝ, D.; RADAČOVSKÁ, K.; HANÁČEK, P. Comprehensive Multiparametric Analysis of Human Deepfake Speech Recognition. Eurasip Journal on Image and Video Processing, 2024, vol. 2024, no. 24, p. 1-25. ISSN: 1687-5281.
Název česky
Komplexní multiparametrická analýza hloubkového rozpoznávání lidské řeči
Typ
článek v časopise
Jazyk
anglicky
Autoři
Malinka Kamil, Mgr., Ph.D. (UITS)
Firc Anton, Ing. (UITS)
Šalko Milan, Ing. (UITS)
Prudký Daniel, Bc.
Radačovská Karolína, Bc.
Hanáček Petr, doc. Dr. Ing. (UITS)
URL
Klíčová slova

Deepfake, Syntetická řeč, Deepfake detekce, Lidské vnímání, Kvalita řeči,
Kybernetická bezpečnost

Abstrakt

V tomto článku se zabýváme novým dvoustranným výzkumem rozpoznávání hluboké
falešné řeči lidmi a řešíme kritické mezery v dosavadním výzkumu. Za prvé, jsme
průkopníky hodnocení vlivu předchozí informace na rozpoznávání deepfake, přičemž
se naše práce odlišuje tím, že simuluje reálné scénáře útoku, kdy jednotlivci
nejsou předem informováni o odhalení deepfake. Tento přístup simuluje
nepředvídatelnost reálných deepfake útoků a poskytuje bezprecedentní vhled do
lidské zranitelnosti za realistických podmínek. Za druhé, zavádíme novou metriku
pro hodnocení kvality deepfake zvuku. Tato metrika usnadňuje hlubší zkoumání
toho, jak kvalita deepfake řeči ovlivňuje přesnost detekce člověka. Tím, že
zkoumáme jak vliv předchozích znalostí o deepfakes, tak roli kvality deepfake
řeči, náš výzkum odhaluje důležitost těchto faktorů, přispívá k pochopení lidské
zranitelnosti vůči deepfakes a navrhuje opatření ke zlepšení lidských detekčních
schopností.

Rok
2024
Strany
25
Časopis
Eurasip Journal on Image and Video Processing, roč. 2024, č. 24, ISSN 1687-5281
DOI
UT WoS
001302501400001
EID Scopus
BibTeX
@article{BUT189344,
  author="Kamil {Malinka} and Anton {Firc} and Milan {Šalko} and Daniel {Prudký} and Karolína {Radačovská} and Petr {Hanáček}",
  title="Comprehensive Multiparametric Analysis of Human Deepfake Speech Recognition",
  journal="Eurasip Journal on Image and Video Processing",
  year="2024",
  volume="2024",
  number="24",
  pages="25",
  doi="10.1186/s13640-024-00641-4",
  issn="1687-5281",
  url="https://jivp-eurasipjournals.springeropen.com/articles/10.1186/s13640-024-00641-4"
}
Nahoru