Detail publikace

STOPA: A Database of Systematic VariaTion Of DeePfake Audio for Source Tracing and Attribution

FIRC Anton, CHIBBER Manasi, MISHRA Jagabandhu, SINGH Vishwanath P., KINNUNEN Tomi a MALINKA Kamil. STOPA: A Database of Systematic VariaTion Of DeePfake Audio for Source Tracing and Attribution. In: 2025. Dostupné z: https://arxiv.org/abs/2505.19644
Název česky
STOPA: Databáze systematické variace deepfake audia pro dohledávání a přiřazování zdrojů
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Firc Anton, Ing. (UITS FIT VUT)
Chibber Manasi (University of Eastern Finland)
Mishra Jagabandhu (University of Eastern Finland)
Singh Vishwanath P. (University of Eastern Finland)
Kinnunen Tomi (University of Eastern Finland)
Malinka Kamil, Mgr., Ph.D. (UITS FIT VUT)
URL
Klíčová slova

sledování zdroje, datová sada, anti-spoofing, syntetická řeč, deepfake

Abstrakt

Klíčovou oblastí výzkumu v oblasti detekce deepfake řeči je hledání zdroje - určování původu syntetizovaných nahrávek. Tyto přístupy mohou zahrnovat identifikaci akustického modelu (AM), modelu vokodéru (VM) nebo jiných parametrů specifických pro proces syntézy. Pokrok je však omezen nedostatkem specializovaného, systematicky kurátorovaného datasetu. Abychom tento problém vyřešili, představujeme STOPA, systematicky pestrou a na metadata bohatou datovou sadu pro sledování zdrojů deepfake řeči, která zahrnuje 8 AM, 6 VM a různá nastavení parametrů v 700 tisících vzorků ze 13 různých syntezátorů. Na rozdíl od stávajících datových sad, které se často vyznačují omezenou variabilitou nebo řídkými metadaty, poskytuje STOPA systematicky kontrolovaný rámec pokrývající širší škálu generativních faktorů, jako je volba modelu vokodéru, akustického modelu nebo předtrénovaných vah, což zajišťuje vyšší spolehlivost atribuce. Tato kontrola zvyšuje přesnost atribuce, napomáhá forenzní analýze, detekci deepfake a transparentnosti generativních modelů.

Rok
2025 (v tisku)
Konference
Interspeech Conference, Rotterdam, NL
BibTeX
@INPROCEEDINGS{FITPUB13384,
   author = "Anton Firc and Manasi Chibber and Jagabandhu Mishra and P. Vishwanath Singh and Tomi Kinnunen and Kamil Malinka",
   title = "STOPA: A Database of Systematic VariaTion Of DeePfake Audio for Source Tracing and Attribution",
   year = 2025,
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13384"
}
Nahoru