Detail předmětu
Získávání znalostí z databází
ZZN Ak. rok 2018/2019 zimní semestr 5 kreditů
Základní pojmy související se získáváním znalostí z databází, vztah získávání znalostí a dolování dat. Zdroje dat pro získávání znalostí. Podstata a techniky předzpracování dat pro dolování. Systémy pro získávání znalostí, dotazovací jazyky pro dolování. Techniky dolování různých typů znalostí - asociační pravidla, klasifikace a predikce, shlukování. Dolování v netradičních datech - proudech dat, časových řadách a posloupnostech, grafech, prostorových a časoprostorových datech, multimediálních datech. Dolování v textu a na webu. Vypracování projektu využitím dostupného nástroje pro dolování v datech.
Garant předmětu
Koordinátor předmětu
Jazyk výuky
Zakončení
Rozsah
- 39 hod. přednášky
- 13 hod. projekty
Bodové hodnocení
- 51 bodů závěrečná zkouška (písemná část)
- 15 bodů půlsemestrální test (písemná část)
- 34 bodů projekty
Zajišťuje ústav
Přednášející
Cvičící
Stránky předmětu
Získané dovednosti, znalosti a kompetence z předmětu
- Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z databází.
- Jsou schopni nástroje pro získávání znalostí používat i vytvářet.
- Student se naučí odborné terminologii v českém i anglickém jazyce.
- Student získá zkušenost s řešením projektů v malém týmu.
- Student se zdokonalí v prezentaci a obhajobě výsledků projektu.
Cíle předmětu
Seznámit studenty s problematikou získávání znalostí z různých typů datových zdrojů, vysvětlit typy užitečných znalostí a jednotlivé kroky procesu získávání znalostí z dat a seznámit je s technikami, algoritmy a nástroji používanými při tomto procesu.
Proč je předmět vyučován
Vzhledem k neustále rostoucím objemům dat ukládaným v současnosti v databázích je potřeba hledat v datech pomocí pokročilých metod nové znalosti, které nelze získat běžným dotazováním. Proto je potřeba se seznámit s celým procesem získávání znalostí, který zahrnuje předzpracování dat i samotné získávání znalostí, kde jsou využívány metody z různých oborů, jako např. strojové učení nebo statistika.
Požadované prerekvizitní znalosti a dovednosti
- Znalost základů pravděpodobnosti a statistiky.
- Znalost databázových technologií na úrovni bakalářského předmětu.
Technické vybavení
volně dostupné
- RapidMiner
Literatura studijní
- Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.
Literatura referenční
- Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, 703 p., ISBN 978-0-12-381479-1.
- Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.
Osnova přednášek
- Úvod - motivace, základní pojmy, typy zdrojů dat a získávaných znalostí, metodologie.
- Předzpracování dat v procesu získávání znalostí - charakteristiky dat.
- Předzpracování dat v procesu získávání znalostí - metody předzpracování.
- Datové sklady a technologie OLAP pro získávání znalostí z databází.
- Dolování frekventovaných vzorů a asociací - základní pojmy, efektivní a škálovatelné metody hledání frekventovaných množin.
- Víceúrovňová asociační pravidla, asociační a korelační analýza, omezená asociační pravidla.
- Klasifikace a predikce - základní pojmy, rozhodovací strom, bayesovská klasifikace, klasifikace založená na pravidlech.
- Klasifikace s využitím neuronových sítí, SVM klasifikátor, další metody klasifikace, predikce.
- Shluková analýza - základní pojmy, typy dat při shlukování, metody založené na rozčleňování, hierarchické metody.
- Další metody shlukování. Dolování v biologických datech.
- Úvod do dolování v proudech dat, časových řadách a posloupnostech.
- Úvod do dolování v grafech, časoprostorových datech, datech pohybujících se objektů a multimediálních datech.
- Dolování textu a na webu.
Osnova ostatní - projekty, práce
- Vypracování projektu v prostředí dostupného nástroje pro získávání znalostí z databází.
Průběžná kontrola studia
Půlsemestrální písemná zkouška, formulace dolovací úlohy, obhajoba projektu.
Podmínky zápočtu:
Udělení zápočtu je podmíněno vypracováním projektu, jeho obhajobou v předepsaných termínech a ziskem minimálně 24 bodů za bodované aktivity v průběhu semestru.
Kontrolovaná výuka
Půlsemestrální písemná zkouška, formulace dolovací úlohy, prezentace projektu. Pro získání bodů ze zkoušky je nutné zkoušku vypracovat tak, aby byla hodnocena nejméně 20 body. V opačném případě bude zkouška hodnocena 0 body.
Podmínky zápočtu
Udělení zápočtu je podmíněno vypracováním projektu, jeho obhajobou v předepsaných termínech a ziskem minimálně 24 bodů za bodované aktivity v průběhu semestru.
Zařazení předmětu ve studijních plánech
- Program IT-MGR-2, obor MBI, MIN, 2. ročník, povinný
- Program IT-MGR-2, obor MBS, libovolný ročník, povinně volitelný skupina S
- Program IT-MGR-2, obor MGM, 2. ročník, volitelný
- Program IT-MGR-2, obor MIS, 2. ročník, povinně volitelný skupina N
- Program IT-MGR-2, obor MMI, MMM, libovolný ročník, volitelný
- Program IT-MGR-2, obor MPV, libovolný ročník, povinně volitelný skupina D
- Program IT-MGR-2, obor MSK, 2. ročník, povinně volitelný skupina M