Detail publikace

Nalezení slovních kořenů v češtině

CHMELAŘ, P.; HELLEBRAND, D.; HRUŠECKÝ, M.; BARTÍK, V. Nalezení slovních kořenů v češtině. CEUR Workshop Proceedings, 2011, roč. 2011, č. 802, s. 1-12. ISSN: 1613-0073.
Název anglicky
Czech Stemming Algorithm
Typ
článek v časopise
Jazyk
česky
Autoři
Chmelař Petr, Ing.
Hellebrand David, Ing.
Hrušecký Michal
Bartík Vladimír, Ing., Ph.D. (UIFS)
URL
Abstrakt

Cílem bylo vytvořit stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používa- jícím slovník pro vyhledávání a dolování českého textu. Článek obsahuje základy slovotvorby českého jazyka pro různé slovní druhy, popis problematiky stematizace a několika stematizačních a lematizačních algoritmů. Hlavním přínosem této práce je Snowball implementace stematizačního algoritmu českého jazyka na základě kompletní sady všech předpon a přípon, které se mohou v českém jazyce vyskytovat.

Rok
2011
Strany
1–12
Časopis
CEUR Workshop Proceedings, roč. 2011, č. 802, ISSN 1613-0073
Kniha
Selected papers from the 10th annual Czech and Slovak knowledge technology conference (Znalosti 2011)
Vydavatel
Aachen University of Technology
Místo
Aachen
BibTeX
@article{BUT91156,
  author="Petr {Chmelař} and David {Hellebrand} and Michal {Hrušecký} and Vladimír {Bartík}",
  title="Nalezení slovních kořenů v češtině",
  journal="CEUR Workshop Proceedings",
  year="2011",
  volume="2011",
  number="802",
  pages="1--12",
  issn="1613-0073",
  url="http://www.ceur-ws.org/Vol-802"
}
Nahoru