Detail publikace
ROXSD: The ROXANNE Multimodal and Simulated Dataset for Advancing Criminal Investigations
DIKICI, E.
Madikeri Srikanth
RANGAPPA, P.
Backfried Gerhard
Rohdin Johan Andréas, M.Sc., Ph.D. (UPGM)
Schwarz Petr, Ing., Ph.D. (UPGM)
Kováč Marek, Ing.
Malý Květoslav, Ing.
Boboš Dominik, Ing.
KLAKOW, D.
Sergidou Eleni Konstantina
a další
Multimodal and Simulated Dataset, Advancing Criminal Investigations
Projekt ROXANNE, vedený pod Evropskou
Unijní program Horizont 2020, jehož cílem je převrat
vyšetřování trestných činů integrací řeči, jazyka a
video technologie s analýzou kriminální sítě. Navzdory tomu
úspěch ve vývoji technologií, projekt čelil hodnocení
problémy kvůli nedostatku a zákonným omezením
ing reálných datových sad o trestné činnosti. V reakci na to představujeme
duce ROXSD, simulovaný datový soubor komunikace v organizaci
nizovaný zločin. ROXSD je soubor odposlouchávaných konverzací (sl.
prostřednictvím poskytovatelů komunikačních služeb) mezi drogami
jednání s podezřelými podle realistického scénáře (vč.
podmínky a omezení skutečného vyšetřování).
ze strany donucovacích orgánů (LEA). Se zaměřením na multi-
modalita a mnohojazyčnost, soubor dat obsahuje 20 hodin
telefonické a video konverzace zahrnující 104 mluvčích a
je dále zarovnán s anotacemi základní pravdy pro každý modální
umožňující přesné vyhodnocení a rozvoj
technologií. Navíc jsou rozšířena multimodální data
s metadaty a předchozími znalostmi (např. biometrické údaje podezřelých).
profily), který je obvykle dostupný v důsledku zákonného
zachycená komunikace. Tento článek představuje ROXSD jako a
klíčový zdroj pro pokrok technologie v kriminálním výzkumu
(konkrétně v oblasti analýzy řeči, textu a sítě).
ROXSD nejen usnadňuje vývoj technologií
a hodnocení, ale také ukazuje potenciál sim-
datové soubory pro rozvoj v oblasti analýzy organizovaného zločinu
ics, zdůrazňující důležitost takových datových sad v nepřítomnosti
komplexních reálných alternativ.
@inproceedings{BUT193433,
author="MOTLÍČEK, P. and DIKICI, E. and MADIKERI, S. and RANGAPPA, P. and BACKFRIED, G. and ROHDIN, J. and SCHWARZ, P. and KOVÁČ, M. and MALÝ, K. and BOBOŠ, D. and KLAKOW, D. and SERGIDOU, E.",
title="ROXSD: The ROXANNE Multimodal and Simulated Dataset for Advancing Criminal Investigations",
booktitle="Proceedings of Odyssey 2024: The Speaker and Language Recognition Workshop",
year="2024",
pages="17--24",
publisher="International Speech Communication Association",
address="Québec City",
doi="10.21437/odyssey.2024-3",
url="https://www.isca-archive.org/odyssey_2024/motlicek24_odyssey.pdf"
}