Detail publikace
STOPA: A Database of Systematic VariaTion Of DeePfake Audio for Source Tracing and Attribution
Chibber Manasi (University of Eastern Finland)
Mishra Jagabandhu (University of Eastern Finland)
Singh Vishwanath P. (University of Eastern Finland)
Kinnunen Tomi (University of Eastern Finland)
Malinka Kamil, Mgr., Ph.D. (UITS FIT VUT)
sledování zdroje, datová sada, anti-spoofing, syntetická řeč, deepfake
Klíčovou oblastí výzkumu v oblasti detekce deepfake řeči je hledání zdroje - určování původu syntetizovaných nahrávek. Tyto přístupy mohou zahrnovat identifikaci akustického modelu (AM), modelu vokodéru (VM) nebo jiných parametrů specifických pro proces syntézy. Pokrok je však omezen nedostatkem specializovaného, systematicky kurátorovaného datasetu. Abychom tento problém vyřešili, představujeme STOPA, systematicky pestrou a na metadata bohatou datovou sadu pro sledování zdrojů deepfake řeči, která zahrnuje 8 AM, 6 VM a různá nastavení parametrů v 700 tisících vzorků ze 13 různých syntezátorů. Na rozdíl od stávajících datových sad, které se často vyznačují omezenou variabilitou nebo řídkými metadaty, poskytuje STOPA systematicky kontrolovaný rámec pokrývající širší škálu generativních faktorů, jako je volba modelu vokodéru, akustického modelu nebo předtrénovaných vah, což zajišťuje vyšší spolehlivost atribuce. Tato kontrola zvyšuje přesnost atribuce, napomáhá forenzní analýze, detekci deepfake a transparentnosti generativních modelů.
@INPROCEEDINGS{FITPUB13384, author = "Anton Firc and Manasi Chibber and Jagabandhu Mishra and P. Vishwanath Singh and Tomi Kinnunen and Kamil Malinka", title = "STOPA: A Database of Systematic VariaTion Of DeePfake Audio for Source Tracing and Attribution", year = 2025, language = "english", url = "https://www.fit.vut.cz/research/publication/13384" }