Detail publikace

A Game for Crowdsourcing Adversarial Examples for False Information Detection

ČEGIŇ, J. A Game for Crowdsourcing Adversarial Examples for False Information Detection. In CEUR Workshop Proceedings. CEUR Workshop Proceedings. Vídeň: CEUR-WS.org, 2022. p. 13-25. ISSN: 1613-0073.

Název česky

Hra pro Crowdsourcing: Příklady odporu při odhalování falešných informací

Typ

článek ve sborníku konference

Jazyk

anglicky

Autoři

Čegiň Ján, Ing. (UPGM)
a další

URL

https://ceur-ws.org/Vol-3275/paper2.pdf

Klíčová slova

generování kontradiktorních dat, detekce falešných informací, hra s účelem, úkol lidské interakce, strojové učení

Abstrakt

Modely detekce falešných informací jsou náchylné k útokům protivníka. Taková náchylnost je kritickou slabinou detekčních modelů. Automatizované vytváření nepřátelských vzorků může nakonec pomoci rozšířit trénovací sady a vytvořit robustnější modely detekce. Automaticky generované vzorky protivníka však často nezachovají význam obsažený v původním textu, což vede ke ztrátě informací. Jsou potřeba generátory nepřátelských vzorků, které dokážou zachovat původní význam. Abychom prozkoumali vlastnosti, které by takové generátory měly mít, a abychom informovali o jejich budoucím designu, provedli jsme studii ke sběru nepřátelských vzorků od lidských agentů pomocí hry s určitým účelem (GWAP). Cílem hráče je upravovat daný tweet, dokud není detekční model oklamán, čímž se vytvoří nepřátelský vzorek. Kvalitativně jsme analyzovali shromážděné vzorky protivníků a identifikovali požadované vlastnosti/strategie, které by měl generátor zachovávání významu protivníka vykazovat. Tyto strategie jsou ověřeny na modelech detekce založených na transformátoru a modelech LSTM, aby se potvrdila jejich použitelnost na různých modelech. Na základě těchto zjištění navrhujeme nový generátorový přístup, který bude vykazovat požadované vlastnosti, aby bylo možné generovat vysoce kvalitní vzorky protivníků uchovávajících informace.

Rok

2022

Strany

13–25

Časopis

CEUR Workshop Proceedings, roč. 2022, č. 2022, ISSN 1613-0073

Sborník

CEUR Workshop Proceedings

Vydavatel

CEUR-WS.org

Místo

Vídeň

EID Scopus

2-s2.0-85143356933

BibTeX

@inproceedings{BUT182948,
  author="Ján {Čegiň}",
  title="A Game for Crowdsourcing Adversarial Examples for False Information Detection",
  booktitle="CEUR Workshop Proceedings",
  year="2022",
  journal="CEUR Workshop Proceedings",
  volume="2022",
  number="2022",
  pages="13--25",
  publisher="CEUR-WS.org",
  address="Vídeň",
  issn="1613-0073",
  url="https://ceur-ws.org/Vol-3275/paper2.pdf"
}