Detail publikace

A New Approach to Pseudoword Generation

OTRUSINA, L.; SMRŽ, P. A New Approach to Pseudoword Generation. Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10). Valletta: European Language Resources Association, 2010. p. 1-5. ISBN: 2-9517408-6-7.
Název česky
Nový přístup ke generování pseudo-slov
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Klíčová slova

pseudo-words, word sense disambiguation, evaluation, SVM

Abstrakt

Korpusy tagované na významy slova jsou používány na vyhodnocování algoritmů pro zjednoznačňování slovních významů. Ruční tvorba takových korpusů je velmi náročná. Kvůli tomu byl představen koncept pseudo-slov, která byla integrována do procesu vyhodnocování systému pro zjednoznačňování slovních významů. Tento článek prezentuje nový přístup ke generování pseudo-slov, založený na sémantické blízkosti kandidátních slov pro tvorbu pseudo-slov. Tato nová metoda je porovnána se standardními přístupy a je ukázáno, že dává lepší výsledky. K tvorbě pseudo-slov jsou využity dvě techniky využívající sémantickou blízkost. První využívá ručně vytvořených slovníků jako je WordNet a druhá pak automaticky spočítaná statistická data z velkých korpusů. Na závěr jsou diskutovány výhody a nevýhody našeho přístupu.

Rok
2010
Strany
1–5
Sborník
Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10)
ISBN
2-9517408-6-7
Vydavatel
European Language Resources Association
Místo
Valletta
BibTeX
@inproceedings{BUT35423,
  author="Lubomír {Otrusina} and Pavel {Smrž}",
  title="A New Approach to Pseudoword Generation",
  booktitle="Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10)",
  year="2010",
  pages="1--5",
  publisher="European Language Resources Association",
  address="Valletta",
  isbn="2-9517408-6-7"
}
Nahoru