Detail publikace

Nalezení slovních kořenů v češtině

CHMELAŘ, P.; HELLEBRAND, D.; HRUŠECKÝ, M.; BARTÍK, V. Nalezení slovních kořenů v češtině. CEUR Workshop Proceedings, 2011, roč. 2011, č. 802, s. 1-12. ISSN: 1613-0073.

Název anglicky

Czech Stemming Algorithm

Typ

článek v časopise

Jazyk

česky

Autoři

Chmelař Petr, Ing.
Hellebrand David, Ing.
Hrušecký Michal
Bartík Vladimír, Ing., Ph.D. (UIFS)

URL

http://www.ceur-ws.org/Vol-802

Abstrakt

Cílem bylo vytvořit stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používa- jícím slovník pro vyhledávání a dolování českého textu. Článek obsahuje základy slovotvorby českého jazyka pro různé slovní druhy, popis problematiky stematizace a několika stematizačních a lematizačních algoritmů. Hlavním přínosem této práce je Snowball implementace stematizačního algoritmu českého jazyka na základě kompletní sady všech předpon a přípon, které se mohou v českém jazyce vyskytovat.

Rok

2011

Strany

1–12

Časopis

CEUR Workshop Proceedings, roč. 2011, č. 802, ISSN 1613-0073

Kniha

Selected papers from the 10th annual Czech and Slovak knowledge technology conference (Znalosti 2011)

Vydavatel

Aachen University of Technology

Místo

Aachen

BibTeX

@article{BUT91156,
  author="Petr {Chmelař} and David {Hellebrand} and Michal {Hrušecký} and Vladimír {Bartík}",
  title="Nalezení slovních kořenů v češtině",
  journal="CEUR Workshop Proceedings",
  year="2011",
  volume="2011",
  number="802",
  pages="1--12",
  issn="1613-0073",
  url="http://www.ceur-ws.org/Vol-802"
}