Detail publikace

Deepfake Speech Detection: A Spectrogram Analysis

FIRC Anton, MALINKA Kamil a HANÁČEK Petr. Deepfake Speech Detection: A Spectrogram Analysis. In: Proceedings of the ACM Symposium on Applied Computing. Avila: Association for Computing Machinery, 2024, s. 1312-1320. ISBN 979-8-4007-0243-3. Dostupné z: https://dl.acm.org/doi/10.1145/3605098.3635911
Název česky
Detekce deepfake řeči: Analýza spektrogramů
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Firc Anton, Ing. (UITS FIT VUT)
Malinka Kamil, Mgr., Ph.D. (UITS FIT VUT)
Hanáček Petr, doc. Dr. Ing. (UITS FIT VUT)
URL
Klíčová slova

Deepfake, Řeč, Obrazová, Detekce Deepfake, Spektrogram

Abstrakt

Současné hlasové biometrické systémy nemají žádnou přirozenou mechaniku, která by je chránila před útoky typu deepfake spoofing. Proto je nutné tyto systémy podpořit řešením pro detekci deepfake. Jedním z nejnovějších přístupů k hloubkové detekci falešné řeči je reprezentace řeči jako spektrogramu a jeho použití jako vstupu pro hlubokou neuronovou síť. Tato práce proto analyzuje proveditelnost různých spektrogramů pro hloubkovou detekci falešné řeči. Porovnáváme jejich typy z hlediska jejich výkonu, hardwarových nároků a rychlosti. Ukazujeme, že většina spektrogramů je pro hloubkovou detekci falešné řeči použitelná. Neexistuje však obecná, správná odpověď na výběr nejlepšího spektrogramu. Jak ukazujeme, různé spektrogramy jsou vhodné pro různé potřeby.

Rok
2024
Strany
1312-1320
Sborník
Proceedings of the ACM Symposium on Applied Computing
Konference
ACM Symposium On Applied Computing, Avila, ES
ISBN
979-8-4007-0243-3
Vydavatel
Association for Computing Machinery
Místo
Avila, ES
DOI
UT WoS
001236958200192
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12908,
   author = "Anton Firc and Kamil Malinka and Petr Han\'{a}\v{c}ek",
   title = "Deepfake Speech Detection: A Spectrogram Analysis",
   pages = "1312--1320",
   booktitle = "Proceedings of the ACM Symposium on Applied Computing",
   year = 2024,
   location = "Avila, ES",
   publisher = "Association for Computing Machinery",
   ISBN = "979-8-4007-0243-3",
   doi = "10.1145/3605098.3635911",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12908"
}
Nahoru