Detail publikace

STOPA: A Database of Systematic VariaTion Of DeePfake Audio for Source Tracing and Attribution

FIRC Anton, CHIBBER Manasi, MISHRA Jagabandhu, SINGH Vishwanath P., KINNUNEN Tomi a MALINKA Kamil. STOPA: A Database of Systematic VariaTion Of DeePfake Audio for Source Tracing and Attribution. In: 2025. Dostupné z: https://arxiv.org/abs/2505.19644

Název česky

STOPA: Databáze systematické variace deepfake audia pro dohledávání a přiřazování zdrojů

Typ

článek ve sborníku konference

Jazyk

angličtina

Autoři

Firc Anton, Ing. (UITS FIT VUT)
Chibber Manasi (University of Eastern Finland)
Mishra Jagabandhu (University of Eastern Finland)
Singh Vishwanath P. (University of Eastern Finland)
Kinnunen Tomi (University of Eastern Finland)
Malinka Kamil, Mgr., Ph.D. (UITS FIT VUT)

URL

https://arxiv.org/abs/2505.19644

Klíčová slova

sledování zdroje, datová sada, anti-spoofing, syntetická řeč, deepfake

Abstrakt

Klíčovou oblastí výzkumu v oblasti detekce deepfake řeči je hledání zdroje - určování původu syntetizovaných nahrávek. Tyto přístupy mohou zahrnovat identifikaci akustického modelu (AM), modelu vokodéru (VM) nebo jiných parametrů specifických pro proces syntézy. Pokrok je však omezen nedostatkem specializovaného, systematicky kurátorovaného datasetu. Abychom tento problém vyřešili, představujeme STOPA, systematicky pestrou a na metadata bohatou datovou sadu pro sledování zdrojů deepfake řeči, která zahrnuje 8 AM, 6 VM a různá nastavení parametrů v 700 tisících vzorků ze 13 různých syntezátorů. Na rozdíl od stávajících datových sad, které se často vyznačují omezenou variabilitou nebo řídkými metadaty, poskytuje STOPA systematicky kontrolovaný rámec pokrývající širší škálu generativních faktorů, jako je volba modelu vokodéru, akustického modelu nebo předtrénovaných vah, což zajišťuje vyšší spolehlivost atribuce. Tato kontrola zvyšuje přesnost atribuce, napomáhá forenzní analýze, detekci deepfake a transparentnosti generativních modelů.

Rok

2025 (v tisku)

Konference

Interspeech Conference, Rotterdam, NL

BibTeX

@INPROCEEDINGS{FITPUB13384,
   author = "Anton Firc and Manasi Chibber and Jagabandhu Mishra and P. Vishwanath Singh and Tomi Kinnunen and Kamil Malinka",
   title = "STOPA: A Database of Systematic VariaTion Of DeePfake Audio for Source Tracing and Attribution",
   year = 2025,
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13384"
}