Detail publikace

ROXSD: The ROXANNE Multimodal and Simulated Dataset for Advancing Criminal Investigations

MOTLÍČEK, P.; DIKICI, E.; MADIKERI, S.; RANGAPPA, P.; BACKFRIED, G.; ROHDIN, J.; SCHWARZ, P.; KOVÁČ, M.; MALÝ, K.; BOBOŠ, D.; KLAKOW, D.; SERGIDOU, E. ROXSD: The ROXANNE Multimodal and Simulated Dataset for Advancing Criminal Investigations. Proceedings of Odyssey 2024: The Speaker and Language Recognition Workshop. Québec City: International Speech Communication Association, 2024. p. 17-24.
Název česky
ROXSD: Multimodální simulovaný dataset projektu ROXANNE pro pokrok ve vyšetřování trestných činů
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Motlíček Petr, doc. Ing., Ph.D. (UPGM)
DIKICI, E.
Madikeri Srikanth
RANGAPPA, P.
Backfried Gerhard
Rohdin Johan Andréas, M.Sc., Ph.D. (UPGM)
Schwarz Petr, Ing., Ph.D. (UPGM)
Kováč Marek, Ing.
Malý Květoslav, Ing.
Boboš Dominik, Ing.
KLAKOW, D.
Sergidou Eleni Konstantina
a další
URL
Klíčová slova

Multimodal and Simulated Dataset, Advancing Criminal Investigations

Abstrakt

Projekt ROXANNE, vedený pod Evropskou
Unijní program Horizont 2020, jehož cílem je převrat
vyšetřování trestných činů integrací řeči, jazyka a
video technologie s analýzou kriminální sítě. Navzdory tomu
úspěch ve vývoji technologií, projekt čelil hodnocení
problémy kvůli nedostatku a zákonným omezením
ing reálných datových sad o trestné činnosti. V reakci na to představujeme
duce ROXSD, simulovaný datový soubor komunikace v organizaci
nizovaný zločin. ROXSD je soubor odposlouchávaných konverzací (sl.
prostřednictvím poskytovatelů komunikačních služeb) mezi drogami
jednání s podezřelými podle realistického scénáře (vč.
podmínky a omezení skutečného vyšetřování).
ze strany donucovacích orgánů (LEA). Se zaměřením na multi-
modalita a mnohojazyčnost, soubor dat obsahuje 20 hodin
telefonické a video konverzace zahrnující 104 mluvčích a
je dále zarovnán s anotacemi základní pravdy pro každý modální
umožňující přesné vyhodnocení a rozvoj
technologií. Navíc jsou rozšířena multimodální data
s metadaty a předchozími znalostmi (např. biometrické údaje podezřelých).
profily), který je obvykle dostupný v důsledku zákonného
zachycená komunikace. Tento článek představuje ROXSD jako a
klíčový zdroj pro pokrok technologie v kriminálním výzkumu
(konkrétně v oblasti analýzy řeči, textu a sítě).
ROXSD nejen usnadňuje vývoj technologií
a hodnocení, ale také ukazuje potenciál sim-
datové soubory pro rozvoj v oblasti analýzy organizovaného zločinu
ics, zdůrazňující důležitost takových datových sad v nepřítomnosti
komplexních reálných alternativ.

Rok
2024
Strany
17–24
Sborník
Proceedings of Odyssey 2024: The Speaker and Language Recognition Workshop
Konference
Odyssey 2024: The Speaker and Language Recognition Workshop, Quebec, Canada, CA
Vydavatel
International Speech Communication Association
Místo
Québec City
DOI
BibTeX
@inproceedings{BUT193433,
  author="MOTLÍČEK, P. and DIKICI, E. and MADIKERI, S. and RANGAPPA, P. and BACKFRIED, G. and ROHDIN, J. and SCHWARZ, P. and KOVÁČ, M. and MALÝ, K. and BOBOŠ, D. and KLAKOW, D. and SERGIDOU, E.",
  title="ROXSD: The ROXANNE Multimodal and Simulated Dataset for Advancing Criminal Investigations",
  booktitle="Proceedings of Odyssey 2024: The Speaker and Language Recognition Workshop",
  year="2024",
  pages="17--24",
  publisher="International Speech Communication Association",
  address="Québec City",
  doi="10.21437/odyssey.2024-3",
  url="https://www.isca-archive.org/odyssey_2024/motlicek24_odyssey.pdf"
}
Soubory
Nahoru