Detail publikace

WTF-LOD - A New Resource for Large-Scale NER Evaluation

OTRUSINA, L.; SMRŽ, P. WTF-LOD - A New Resource for Large-Scale NER Evaluation. In Proceedings of the Tenth conference on International Language Resources and Evaluation (LREC'16). Portorož: European Language Resources Association, 2016. p. 3299-3302. ISBN: 978-2-9517408-9-1.
Název česky
WTF-LOD - Nový zdroj pro vyhodnocování NER systémů
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Klíčová slova

named entity evaluation, linked open data, CommonCrawl, ClueWeb, Wikipedia

Abstrakt

Tento článek představuje rozsáhlou datovou sadu pro vyhodnocování systémů pro rozpoznávání jmenných entit. Nejprve pojednává o procesu sběru dat z největších volně dostupných textových korpusů jako jsou Wikipedie, CommonCrawl a ClueWeb09/12. Dále jsou diskutovány ostatní podobné existující korpusy, jako jsou např. WikiLinks a WikiReverse. Naše práce se přednostně zaměřuje na textové dokumenty, deduplikaci dat a pokročilé techniky čištění dat. Prezentovaná datová sada je jednou z největších dostupných datových sad svého druhu a je vhodná pro komplexní vyhodnocování systémů pro zjednoznačňování jmenných entit, včetně mnohoznačných jmen.

Rok
2016
Strany
3299–3302
Sborník
Proceedings of the Tenth conference on International Language Resources and Evaluation (LREC'16)
ISBN
978-2-9517408-9-1
Vydavatel
European Language Resources Association
Místo
Portorož
UT WoS
000526952503084
EID Scopus
BibTeX
@inproceedings{BUT130955,
  author="Lubomír {Otrusina} and Pavel {Smrž}",
  title="WTF-LOD - A New Resource for Large-Scale NER Evaluation",
  booktitle="Proceedings of the Tenth conference on International Language Resources and Evaluation (LREC'16)",
  year="2016",
  pages="3299--3302",
  publisher="European Language Resources Association",
  address="Portorož",
  isbn="978-2-9517408-9-1"
}
Nahoru