Detail publikace

IDIAPers @ Causal News Corpus 2022: Extracting Cause-Effect-Signal Triplets via Pre-trained Autoregressive Language Model

FAJČÍK, M.; SMRŽ, P.; MOTLÍČEK, P.; BURDISSO, S. IDIAPers @ Causal News Corpus 2022: Extracting Cause-Effect-Signal Triplets via Pre-trained Autoregressive Language Model. In Proceedings of the 5th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE 2022). Abu Dhabi: Association for Computational Linguistics, 2022. p. 70-78. ISBN: 978-1-959429-05-0.
Název česky
IDIAPers @ Causal News Corpus 2022: Extrahování tripletů příčina-účinek-signál prostřednictvím předtrénovaného autoregresivního jazykového modelu
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

extrakce kauzálnych vztahov, kauzálne vztahy, príčina, signál, následek, novinové média,

Abstrakt

V tomto článku popisujeme podúkol 2 v CASE-2022, Event Causality Identification with Casual News Corpus. Výzva se zaměřila na automatickou detekci všech textovych rozsahů příčina-následok-signál konstrukcí přítomných ve větě ze zpravodajských médií. Rozsahy zjišťujeme pomocí T5 --- předtrénovaného autoregresivního jazykového modelu. Iterativně identifikujeme všechny triplety textovych rozsahů příčina-následek-signál, přičemž vždy podmiňujeme predikci dalšího tripletu na dříve predikovaných. Abychom predikovali samotný triplet, uvažujeme různé kauzální vztahy, jako napr. příčina->následek->signál. Každá složka tripletu je generována pomocí jazykového modelu podmíněného větou, předchozími částmi aktuálního tripletu a dříve predikovanými triplety. Navzdory tréninku na extrémně malém datovém souboru 160 vzorků náš přístup dosáhl konkurenceschopného výkonu a umístil se na druhém místě v soutěži. Dále ukazujeme, že za kauzalnych predpokladov příčina->následek, nebo následek->příčina, dosáhne systém podobných výsledků.

Rok
2022
Strany
70–78
Sborník
Proceedings of the 5th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE 2022)
ISBN
978-1-959429-05-0
Vydavatel
Association for Computational Linguistics
Místo
Abu Dhabi
DOI
EID Scopus
BibTeX
@inproceedings{BUT185126,
  author="Martin {Fajčík} and Pavel {Smrž} and Petr {Motlíček} and Sergio {Burdisso}",
  title="IDIAPers @ Causal News Corpus 2022: Extracting Cause-Effect-Signal Triplets via Pre-trained Autoregressive Language Model",
  booktitle="Proceedings of the 5th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE 2022)",
  year="2022",
  pages="70--78",
  publisher="Association for Computational Linguistics",
  address="Abu Dhabi",
  doi="10.18653/v1/2022.case-1.10",
  isbn="978-1-959429-05-0",
  url="https://aclanthology.org/2022.case-1.10/"
}
Nahoru