Detail práce
Využití hlubokého učení pro rozpoznání textu v obrazu grafického uživatelského rozhraní
Optické rozpoznání znaků (OCR) je již mnoho let oblastí zájmu. Je definován jako proces digitalizace obrazu dokumentu do sekvence znaků. Navzdory desetiletím intenzivních výzkumů jsou systémy OCR, které jsou srovnatelné s lidským zrakem, stále otevřenou výzvou. V této práci je vytvořen návrh takového systému, je implementován, který je schopen detekovat text v grafických uživatelských rozhraních.
rozpoznání textu, neuronové sítě, konvoluční neuronové sítě, CNN, LSTM, rekurentní neuronové sítě, RNN, hluboké učení neuronových sítí, OCR
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Oponent hodnotil práci stupněm 4F, student poté reagoval na jeho otázky.
- Popište prosím, jaká část celkové doby řešení práce byla věnována jednotlivým částem výsledné práce.
- Kolik času bylo věnováno trénování výsledného modelu a experimentům? Pomohlo by k dosažení alespoň trochu přijatelného řešení/výsledku trénování navrženého modelu po delší dobu?
Burget Radim, Doc. Ing., Ph.D. (UTKO FEKT VUT), člen
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Hradiš Michal, Ing., Ph.D. (UPGM FIT VUT), člen
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT), člen
@mastersthesis{FITMT22173, author = "Pavel Hamern\'{i}k", type = "Diplomov\'{a} pr\'{a}ce", title = "Vyu\v{z}it\'{i} hlubok\'{e}ho u\v{c}en\'{i} pro rozpozn\'{a}n\'{i} textu v obrazu grafick\'{e}ho u\v{z}ivatelsk\'{e}ho rozhran\'{i}", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2019, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/22173/" }