Detail předmětu
Ukládání a příprava dat
UPA Ak. rok 2019/2020 zimní semestr 5 kreditů
Předmět zavádí základní klasifikaci dat z pohledu získávání znalostí z dat a přibližuje v širší úrovni vybrané moderní databázové systémy s tím, že vybrané partie studuje i do hloubky --- jedná se o objektově-relační databáze, prostorové databáze včetně problematiky ukládání a indexace vícerozměrných dat, NoSQL databáze, XML a multimediální databáze, pokročilé možnosti dotazování nad relačními databázemi. Dále je vysvětlen proces získávání znalostí z dat a jeho jednotlivé kroky se zaměřením zejména na typické úlohy předzpracování dat před samotnou extrakcí potenciálně užitečných znalostí z dat. Proces získávání znalostí je ilustrován na případových studiích.
Garant předmětu
Koordinátor předmětu
Jazyk výuky
Zakončení
Rozsah
- 26 hod. přednášky
- 6 hod. cvičení
- 6 hod. pc laboratoře
- 14 hod. projekty
Bodové hodnocení
- 60 bodů závěrečná zkouška (písemná část)
- 20 bodů půlsemestrální test (písemná část)
- 20 bodů projekty
Zajišťuje ústav
Přednášející
Cvičící
Získané dovednosti, znalosti a kompetence z předmětu
Studenti budou schopni klasifikovat data z pohledu získávání znalostí, ukládat a manipulovat data ve vhodných databázových systémech, rychle vyhledávat potřebné údaje, zkoumat vlastnosti dat a připravit je pro následnou extrakci znalostí.
- Student lépe zvládne práci s daty v různých situacích
- Student se zdokonalí v řešení malých projektů v malém týmu
Cíle předmětu
Vysvětlit základní klasifikaci dat a datových zdrojů, podat hlubší pohled na vybrané databázové systémy (objektově-relační, prostorové, NoSQL, XML a multimediální), včetně principů efektivních přístupových metod k datům, dále vysvětlit podstatu a jednotlivé kroky procesu získávání znalostí z dat se zaměřením na předzpracování dat a explorační analýzu.
Proč je předmět vyučován
Předmět si klade za cíl ukázat, jak na složitá data kolem nás, jak je uložit, jak se v nich orientovat, získat z nich užitečné charakteristiky a připravit je pro extrakci skrytých informací/znalostí aplikací metod strojového učení a jiných pokročilých metod analýzy.
Požadované prerekvizitní znalosti a dovednosti
Základy teorie relačního modelu dat. Formalizace návrhu relační databáze. Organizace dat na interní úrovni. Bezpečnost a integrita dat. Transakce. Konceptuální modelování a návrh relační databáze z konceptuálního modelu. Jazyk SQL. Základy počítačové grafiky. Základy výpočetní geometrie. Objektové paradigma. Základy statistiky a pravděpodobnosti.
Osnova přednášek
- Úvod: obsah předmětu, charakter dat, úvod k získávání znalostí z dat, rekapitulace historického vývoje databázových technologií
- Objektově relační DB, objektově-relační mapování, pokročilé vlastnosti SQL
- Prostorové DB: problematika uložení a zpracování
- Prostorové DB: způsoby řešení ukládání
- Indexace v prostorových DB I - bodové útvary
- Indexace v prostorových DB II - vícerozměrné útvary
- Půlsemestrální zkouška
- Multimediální a XML databáze
- NoSQL databáze
- Proces získávání znalostí z dat, předzpracování dat v procesu získávání znalostí - charakteristiky dat, exploratorní analýza.
- Předzpracování dat v procesu získávání znalostí - metody předzpracování.
- Základní úlohy získávání znalostí z dat a příklady odpovídajících metod
- Programovací jazyky používané pro získávání znalostí z dat a ukázkové případové studie získávání znalostí z dat
Osnova numerických cvičení
DEMO cvičení
- Objektově-relační a prostorové databáze, práce v nich, zvláštnosti užití
- Multimediální a XML databáze, indexace dat
- NoSQL databáze
Osnova počítačových cvičení
- Aplikační vazby na objektově relační databáze, aplikace v prostorových databázích
- Multimediální a XML databáze, indexace dat
- NoSQL databáze v aplikacích
Osnova ostatní - projekty, práce
- Vytvoření aplikace a demonstrace vlastností práce s nestrukturovanými i strukturovanými daty různé povahy.
Průběžná kontrola studia
- Půlsemestrální zkouška, u které neexistuje náhradní, či opravný termín.
- Řešení 1 projektu v průběhu semestru a jeho odevzdání ve stanoveném termínu.
Podmínky zápočtu:
Student musí během semestru získat alespoň 50% bodů z možného maxima, tj. 20 bodů ze 40.
Pokud bude odhaleno plagiátorství nebo nedovolená spolupráce na projektech, či u půlsemestrální zkoušky, zápočet nebude udělen a dále bude zváženo zahájení disciplinárního řízení.
Kontrolovaná výuka
- Půlsemestrální zkouška - písemně, formou otázek, kde odpovědi se tvoří celou větou, neexistuje náhradní/opravný termín. (20 bodů)
- Vypracování projektů - 1 projekt (vytvoření programu, dle zadání) s příslušnou dokumentací. (20 bodů)
- Závěrečná zkouška se skládá z otázek, kde odpovědi se tvoří celou větou. Maximální hodnocení zkoušky je 60 bodů, přičemž pro získání bodů ze zkoušky je nutné zkoušku vypracovat tak, aby byla hodnocena nejméně 25 body, v opačném případě bude zkouška hodnocena 0 body. Zkouška má jeden řádný a dva opravné termíny. Řádný termín zkoušky bude realizován písemnou formou, opravné termíny budou realizovány formou písemnou nebo kombinovanou (tedy písemně i ústně v jeden den - ráno písemná, odpoledne ústní část). Forma opravných termínů zkoušky bude oznámena vždy po vyhodnocení předchozího termínu zkoušky, přičemž kombinovaná forma zkoušky může být zvolena tehdy, pokud se daného termínu zkoušky bude moci zúčastnit nejvýše 16 studentů.
Podmínky zápočtu
Student musí během semestru získat alespoň 50% bodů z možného maxima, tj. 20 bodů ze 40.
Pokud bude odhaleno plagiátorství nebo nedovolená spolupráce na projektech, či u půlsemestrální zkoušky, zápočet nebude udělen a dále bude zváženo zahájení disciplinárního řízení.
Zařazení předmětu ve studijních plánech