Detail publikace
IDIAPers @ Causal News Corpus 2022: Efficient Causal Relation Identification Through a Prompt-based Few-shot Approach
Fajčík Martin, Ing., Ph.D. (UPGM)
Smrž Pavel, doc. RNDr., Ph.D. (UPGM)
Motlíček Petr, doc. Ing., Ph.D. (UPGM)
few-shot učení, klasifikátor, identifikace kauzálnych relací, identifikace kauzálnych udalostí, ensembling
V tomto článku popisujeme naši účast na dílčím úkolu 1 CASE-2022, Event Causality Identification with Casual News Corpus. Úlohu identifikace kauzálních vztahů (CRI) řešíme využitím sady jednoduchých, ale komplementárních technik pro jemné ladění jazykových modelů (LM) na malém počtu anotovaných příkladů (tj. konfigurace několika snímků). Při dolaďování LM se řídíme přístupem založeným na promptní predikci, ve kterém je úloha CRI považována za problém maskovaného jazykového modelování (MLM). Tento přístup umožňuje LM nativně předem vyškoleným na problémy MLM přímo generovat textové odpovědi na výzvy specifické pro CRI. Porovnáváme výkon této metody s technikami souboru trénovanými na celém souboru dat. Naše nejvýkonnější podání bylo vyladěno pouze 256 instancemi na třídu, což je 15,7 % všech dostupných údajů, a přesto získalo druhou nejlepší přesnost (0,82), třetí nejlepší přesnost (0,82) a skóre F1 (0,85) velmi blízko tomu, co uvedl vítězný tým (0,86).
@inproceedings{BUT185127,
author="Sergio {Burdisso} and Martin {Fajčík} and Pavel {Smrž} and Petr {Motlíček}",
title="IDIAPers @ Causal News Corpus 2022: Efficient Causal Relation Identification Through a Prompt-based Few-shot Approach",
booktitle="Proceedings of the 5th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE 2022)",
year="2022",
pages="61--69",
publisher="Association for Computational Linguistics",
address="Abu Dhabi",
doi="10.18653/v1/2022.case-1.9",
isbn="978-1-959429-05-0",
url="https://aclanthology.org/2022.case-1.9/"
}