Detail předmětu
Klasifikace a rozpoznávání
KRD Ak. rok 2025/2026 letní semestr
Odhady parametrů pomocí metody maximální věrohodnosti a algoritmu Expectiation-Maximization, formulace objektivní funkce diskriminativního trénování, kritérium Maximum Mutual information (MMI), adaptace GMM modelů, transformace parametrů pro rozpoznávání, modelování prostoru parametrů pomocí diskriminativních podprostorů, faktorová analýza, kernelové techniky, kalibrace a fúze klasifikátorů, aplikace v rozponávání řeči, videa a textu.
Okruhy otázek k SDZ :
- Odhad parametrů modelu s maximální věrohodností (Maximum Likelihood)
- Rozložení pravděpodobnostÍ z exponenciální rodiny (exponencial family) a postačující statistiky (sufficient statistics)
- Model lineární regrese a jeho pravděpodobnostní interpretace
- Bayesovské modely uvažující pravděpodobnostní rozložení (neurčitost) parametrů modelu
- Sdružené apriorní rozložení (conjugate priors) a jejich význam v bayesovských modelech
- Lineární diskriminační analýza (Fishers linear discriminant)
- Rozdíl mezi generativními a diskriminativními klasifikátory; jejich klady a zápory
- Perceptron a jeho učící se algoritmus jako příklad lineárních klasifikátorů
- Generativní lineární klasifikátor - Gaussovský klasifikátor se sdílenou kovarianční maticí
- Diskriminativní klasifikátor založený na lineární logistické regresi
Garant předmětu
Jazyk výuky
Zakončení
Rozsah
- 39 hod. přednášky
Bodové hodnocení
- 100 bodů závěrečná zkouška
Zajišťuje ústav
Cíle předmětu
Porozumět pokročilým technikám a postupům v oblasti klasifikace a rozpoznávání a naučit se aplikovat algoritmy a metody v této oblasti na problémy rozpoznávání mluvené řeči, počítačové grafiky a zpracování přirozeného jazyka. Seznámit se způsoby vyhodnocování úspěšnosti metod. Pochopit specifika diskriminativního trénování a vytváření hybridních systémů.
Studenti se v rámci předmětu seznámí s pokročilými technikami klasifikace a rozpoznávání a naučí se aplikovat metody v této oblasti na vybrané problémy rozpoznávání mluvené řeči, počítačové grafiky a zpracování přirozeného jazyka.
Studenti si vyzkouší obecné přístupy k řešení problémů klasifikace a rozpoznávání.
Požadované prerekvizitní znalosti a dovednosti
Základní znalost statistiky, teorie pravděpodobnosti, matematické analýzy a algebry.
Literatura studijní
- Ian Goodfellow, Yoshua Bengio, Aaron Courville: Deep Learning, MIT Press, 2016.
- Simon Haykin: Neural Networks And Learning Machines, Pearson Education; Third edition, 2016.
Osnova přednášek
- Odhad parametrů Gaussova rozdělení pravděpodobnosti pomocí Maximum Likelihood (ML)
- Odhad parametrů směsi Gaussových rozdělení pravděpodobnosti (Gaussian Mixture Model - GMM) pomocí Expectiation-Maximization (EM)
- Diskriminativní trénování, úvod, formulace objektivní funkce
- Diskriminativní trénování s kritériem Maximum Mutual information (MMI)
- Adaptace GMM modelů - Maximum A-Posteriori (MAP), Maximum Likelihood Linear Regression (MLLR)
- Transformace parametrů pro rozpoznávání - základy, Principal component analysis (PCA)
- Diskriminativní transformace parametrů - Linear Discriminant Analysis (LDA) a Heteroscedastic Linear Discriminant Analysis (HLDA)
- Modelování prostoru parametrů pomocí diskriminativních podprostorů - faktorová analýza
- Kernelové techniky, SVM
- Kalibrace a fúze klasifikátorů
- Aplikace v rozponávání řeči, videa a textu
- Presentace frekventantů kursu I
- Presentace frekventantů kursu II
Průběžná kontrola studia
Ústní zkouška.
Zařazení předmětu ve studijních plánech
- Program DIT, libovolný ročník, povinně volitelný skupina T
- Program DIT, libovolný ročník, povinně volitelný skupina T
- Program DIT-EN (anglicky), libovolný ročník, povinně volitelný skupina T
- Program DIT-EN (anglicky), libovolný ročník, povinně volitelný skupina T