Detail předmětu
Zpracování přirozeného jazyka
ZPD Ak. rok 2019/2020 zimní semestr
Východiska počítačového zpracování přirozeného jazyka, jazyková data v korpusech, roviny: fonetika, fonologie, morfologie, syntax, sémantika, pragmatika, klasické a formální gramatiky: reprezentace morfologických a syntaktických struktur, reprezentace významu, bezkontextové gramatiky a jejich kontextová rozšíření, gramatiky DCG (Definite Clause Grammars), algoritmus CKY (Cocke-Kasami-Younger), chart-parsing, problém víceznačnosti, počítačové slovníky: reprezentace znalostí o lexikálních jednotkách, typy slovníků, lexikální sémantika, reprezentace významu věty, princip kompozicionality: skládání významů, sémantické klasifikace: valenční rámce, predikáty, ontologie, transparentní intenzionální logika a její aplikace na analýzu významů vět přirozeného jazyka, pragmatika: sémantická a pragmatická povaha jmenných skupin, struktura promluvy, deiktické výrazy, kontexty, porozumění jazyku: význam, inference a reprezentace znalostí.
Garant předmětu
Jazyk výuky
Zakončení
Rozsah
- 39 hod. přednášky
Bodové hodnocení
- 100 bodů závěrečná zkouška
Zajišťuje ústav
Přednášející
Cvičící
Získané dovednosti, znalosti a kompetence z předmětu
Studenti se seznámí s metodami, postupy a nástroji, které se používají v oblasti zpracování přirozeného jazyka, budou schopni navrhovat programy pro komunikaci v přirozeném jazyce, analyzátory a jednoduché odvozovací systémy pracující s přirozeným jazykem.
Cíle předmětu
Porozumět počítačovému zpracování přirozeného jazyka a naučit se aplikovat základní algoritmy a metody v této oblasti. Seznámit se s algoritmickým popisem jednotlivých jazykových rovin: morfologické, syntaktické, sémantické a pragmatické a se zdroji jazykových dat - korpusy. Pochopit základní principy reprezentace znalostí, inference a vztahů k umělé inteligenci. Na každé rovině se vždy seznámit s teoretickými východisky, ale i používaným algoritmickým popisem a nástroji. Seznámit se s možnostmi kombinace těchto nástrojů do složitějších systémů.
Osnova přednášek
- Pokročilé metody kategorizace textů, podobnost dokumentů
- Morfologická analýza na počítači, flektivní a derivativní morfologie, struktura trie pro uložení slovníku
- Syntaktická analýza přirozeného jazyka pro jazykové modelování
- Pravděpodobnostní syntaktická analýza, automatické zarovnávání textů, strojový překlad
- Lexikální sémantika, slovníky vs. encyklopedie, princip kompozicionality
- Technologie sémantického webu, ontologie, OWL
Zařazení předmětu ve studijních plánech