Detail předmětu
Bayesovské modely pro strojové učení (v angličtině)
BAYa Ak. rok 2022/2023 zimní semestr 5 kreditů
Teorie pravděpodobnosti a rozdělení pravděpodobnosti, Bayesovská Inference, Inference v Bayesovských modelech s konjugovanými apriorními pravděpodobnostmi, Inference v Bayesovských sítích, Expectation-Maximization algoritmy, Přibližná inference v Bayesovských modelech pomocí Gibbsova vzorkování, Inference pomocí variačního Bayese (VB), Stochastický VB, Modely s nekonečným počtem směsných komponentů, Dirichletovy procesy, Chinese Restaurant procesy, Pitman-Yor proces pro modelování jazyka, Šíření očekávání, Gaussovské procesy, Auto-Encoding Variational Bayes, Praktické aplikace bayesovské inference
Garant předmětu
Koordinátor předmětu
Jazyk výuky
Zakončení
Rozsah
- 26 hod. přednášky
- 13 hod. cvičení
- 13 hod. projekty
Bodové hodnocení
- 51 bodů závěrečná zkouška (písemná část)
- 24 bodů půlsemestrální test (písemná část)
- 25 bodů projekty
Zajišťuje ústav
Přednášející
Cvičící
Cíle předmětu
Demonstrovat omezení hlubokých neuronových sítí (DNN), které se staly velmi populární v mnoha oborech, ale fungují dobře jen v případě dostatečného množství dobře popsaných trénovacích dat. Presentovat Bayesovské modely (BM) umožňující činit spolehlivá rozhodnutí i v případech omezených dat, jelikož berou v úvahu nepřesnosti v odhadu parametrů modelu. Zavést koncept latentních proměnných, které činí BM modulárními (komplexní modely mohou být tedy rozloženy na jednodušší) a vhodné pro případy s chybějícími daty (např. trénování bez učitele v případě chybějících popisů dat). Uvést základní vědomosti a intuice k BM a pokročit ke složitějším tématům: techniky přibližné inference nutné pro složité modely, modely s nekonečným množstvím směsných komponentů v neparametrických BM, nebo Auto-Encoding Variational Bayes. Kurs je veden v angličtině.
Proč je předmět vyučován
V životě kolem nás není nic jistého. Nejistota nás provází i ve strojovém učení, klasifikaci a rozpoznávání - v základních kursech se naučíte, jak trénovat parametry Gaussovských modelů nebo neuronových sítí, ale jsou opravdu dobře? Můžeme si být jisti výsledkem? Jak dopadne model, pokud ho použijeme na data odlišná od trénovacích? Kurs BAY Vás naučí ničemu nevěřit a pokud možno vše vyjadřovat ne jako tvrdá čísla, ale jako pravděpodobnostní rozložení. Užijete si v něm matematiku, ale jestli to se strojovým učením myslíte vážně, nemůžete se na něj dívat jen jako na spojování krabiček, ale mít pevné matematické základy.
Technické vybavení
volně dostupné
- Python
Osnova přednášek
- Teorie pravděpodobnosti a rozdělení pravděpodobnosti.
- Bayesovská Inference (apriorní pravděpodobnosti, nejasnost odhadu parametrů, předpovězená hodnota posteriorních pravděpodobností)
- Inference v Bayesovských modelech s konjugovanými apriorními pravděpodobnostmi.
- Inference v Bayesovských sítích (loopy belief propagation)
- Expectation-Maximization algoritmy (s aplikacemi na Gaussovské směsné modely)
- Přibližná inference v Bayesovských modelech pomocí Gibbsova vzorkování
- Inference pomocí variačního Bayese (VB), Stochastický VB
- Modely s nekonečným počtem směsných komponentů. Dirichletovy procesy. Chinese Restaurant procesy
- Pitman-Yor proces pro modelování jazyka.
- Šíření očekávání (expectation propagation)
- Gaussovské procesy
- Auto-Encoding Variational Bayes
- Praktické aplikace bayesovské inference
Osnova numerických cvičení
Demonstrační cvičení budou následovat okamžitě po přednáškách a budou obsahovat příklady, především v Pythonu. Kód a data pro příklady budou k dispozici studentům a budou tvořit základ projektu.
Osnova ostatní - projekty, práce
Projekt bude následovat demonstrační cvičení, jeho náplní bude zpracování poskytnutých reálných nebo simulovaných dat. Studenti budou pracovat v týmech v "evaluačním" módu a presentovat své výsledky na poslední přednášce/cvičení.
Průběžná kontrola studia
- půlsemestrální zkouška (24b)
- odevzdání a presentace projektu (25b)
- semestrální zkouška 51b.
Pro získání bodů ze zkoušky je nutné získat min. 20 bodů, jinak je zkouška hodnocena 0 body.
Zařazení předmětu ve studijních plánech
- Program IT-MGR-2 (anglicky), obor MGMe, libovolný ročník, povinně volitelný skupina M
- Program MIT-EN (anglicky), libovolný ročník, povinně volitelný skupina B
- Program MITAI, obor NADE, NBIO, NCPS, NEMB, NEMB do 2021/22, NGRI, NHPC, NIDE, NISD, NISY, NISY do 2020/21, NMAT, NNET, NSEC, NSEN, NSPE, NVER, NVIZ, libovolný ročník, volitelný
- Program MITAI, obor NMAL, libovolný ročník, povinný