Detail práce
Hluboké neuronové sítě pro klasifikaci objektů v obraze
Tato práce se zabývá klasifikací objektů v obraze s použitím hlubokých neuronových sítí. Jako algoritmus pro klasifikaci byla zvolena segmentace celé scény pracující na video sekvencích a využívající informace mezi dvěma snímkami videa. Pro tuto úlohu bylo použito extrahování informací pomocí optického toku, na základě kterého byly dále warpovány aktivační mapy vrstev neuronových sítí. Dvě architektury neuronových sítí byly upraveny pro práci s videem, na kterých byly následně provedeny experimenty. Výsledky experimentů ukazují, že použití videa umožňuje zlepšit přesnost (IoU) vůči stejné architektuře pracující s obrázky.
segmentace obrazu, monokulární kamera, hluboké neuronové sítě, video, optický tok, warping, Cityscapes, Keras, Tensorflow
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
- Pokud by úlohou vaší sítě bylo například detekovat chodce (v obraze vyššího než 100 pixelů), jaká by byla očekávatelná úspěšnost detekce? (Zdá se mi, že takový údaj z tabulek výsledků neplyne, je to pravda?)
- V kapitole 4.4. píšete o specifických vlastnostech architektur pro video. Jaké negativní efekty ve videu by se vyskytovaly, pokud byste takové specifické vlastnosti neaplikoval?
Hradiš Michal, Ing., Ph.D. (UPGM FIT VUT), člen
Rogalewicz Adam, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Sochor Jiří, prof. Ing., CSc. (FI MUNI), člen
Španěl Michal, Ing., Ph.D. (UPGM FIT VUT), člen
Zemčík Pavel, prof. Dr. Ing. (UPGM FIT VUT), člen
@mastersthesis{FITMT19405, author = "Tom\'{a}\v{s} Mlynari\v{c}", type = "Diplomov\'{a} pr\'{a}ce", title = "Hlubok\'{e} neuronov\'{e} s\'{i}t\v{e} pro klasifikaci objekt\r{u} v obraze", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2018, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/19405/" }