Detail práce

Využití hlubokého učení pro rozpoznání textu v obrazu grafického uživatelského rozhraní

Diplomová práce Student: Hamerník Pavel Akademický rok: 2018/2019 Vedoucí: Lysek Tomáš, Ing.
Název anglicky
Deep Learning for OCR in GUI
Jazyk práce
český
Abstrakt

Optické rozpoznání znaků (OCR) je již mnoho let oblastí zájmu. Je definován jako proces digitalizace obrazu dokumentu do sekvence znaků. Navzdory desetiletím intenzivních výzkumů jsou systémy OCR, které jsou srovnatelné s lidským zrakem, stále otevřenou výzvou. V této práci je vytvořen návrh takového systému, je implementován, který je schopen detekovat text v grafických uživatelských rozhraních.

Klíčová slova

rozpoznání textu, neuronové sítě, konvoluční neuronové sítě, CNN, LSTM, rekurentní neuronové sítě, RNN, hluboké učení neuronových sítí, OCR

Ústav
Studijní program
Informační technologie, obor Počítačová grafika a multimédia
Soubory
Stav
neobhájeno
Obhajoba
19. června 2019
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Oponent hodnotil práci stupněm 4F, student poté reagoval na jeho otázky.

Otázky u obhajoby
  1. Popište prosím, jaká část celkové doby řešení práce byla věnována jednotlivým částem výsledné práce.
  2. Kolik času bylo věnováno trénování výsledného modelu a experimentům? Pomohlo by k dosažení alespoň trochu přijatelného řešení/výsledku trénování navrženého modelu po delší dobu?
Komise
Zemčík Pavel, prof. Dr. Ing. (UPGM FIT VUT), předseda
Burget Radim, Doc. Ing., Ph.D. (UTKO FEKT VUT), člen
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Hradiš Michal, Ing., Ph.D. (UPGM FIT VUT), člen
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT), člen
Citace
HAMERNÍK, Pavel. Využití hlubokého učení pro rozpoznání textu v obrazu grafického uživatelského rozhraní. Brno, 2019. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2019-06-19. Vedoucí práce Lysek Tomáš. Dostupné z: https://www-dev.fit.vutbr.cz/study/thesis/22173/
BibTeX
@mastersthesis{FITMT22173,
    author = "Pavel Hamern\'{i}k",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Vyu\v{z}it\'{i} hlubok\'{e}ho u\v{c}en\'{i} pro rozpozn\'{a}n\'{i} textu v obrazu grafick\'{e}ho u\v{z}ivatelsk\'{e}ho rozhran\'{i}",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2019,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/22173/"
}
Nahoru