Detail práce
Identifikace znaků na hloubkovém snímku pneumatiky
Táto práca sa zaoberá problémom detekcie, rozpoznania a segmentácie znakov na hĺbkovej snímke pneumatiky. V práci aplikovaný prístup horizontálne rozdelí vstupnú hĺbkovú snímku na prekrývajúce sa časti, v ktorých sú symboly detegované hlbokou neurónovou sieťou Mask R-CNN. Následným použitím algoritmu potlačenia nemaximálnych hodnôt sú zahodené duplicitné detekcie vznikajúce kvôli prekryvom. V práci je tiež predstavená modifikácia siete Mask R-CNN používajúca zdvojenú segmentačnú vetvu za účelom kvalitnejšej segmentácie symbolov s tenkými líniami a členitou maskou. Použitím navrhnutého prístupu dosiahla na pripravenej dátovej sade metrika mean average precision s IoU v intervale od 0,5 do 0,95 hodnotu 0,877 pre detekciu a 0,738 pre segmentáciu.
hĺbková snímka pneumatiky, hlboké učenie, Mask R-CNN, U-Net, segmentácia obrazu, identifikácia znakov, inštančná segmentácia, sémantická segmentácia, nerovnovážna dátová sada, zdvojená segmentačná vrstva
Zveřejnění bakalářské práce je v souladu s ustanovením § 47b odst. 4 zákona č. 111/1998 Sb., o vysokých školách a o změně a doplnění dalších zákonů (zákon o vysokých školách), ve znění pozdějších předpisů, odloženo o 3 roky. Důvodem odložení zveřejnění je ochrana duševního vlastnictví a skutečnost, že bakalářská práce obsahuje obchodní tajemství ve smyslu příslušných ustanovení zákona č. 89/2012 Sb., občanského zákoníku.
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
- Proč jste nepoužil generovaná data, která by proti stávající datové sadě měla jistě mnoho výhod?
- V použitých hloubkových datech by zřejmě bylo velice robustní generovat návrhy na výskyt jednotlivých symbolů nějakým konvenčním způsobem a navržené regiony pak klasifikovat neuronovou sítí. V čem by takový přístup byl ne/výhodnější než řešení celého problému naráz pomocí Faster R-CNN / Mask R-CNN?
- Experimenty ukazují, že použití augmentací při učení nic nepřináší. To je poněkud nezvyklé - jaké pro to máte vysvětlení?
- Jak to, že jsou výsledné obrázky krásně zarovnané? Chybí jakákoli rotace.
Kočí Radek, Ing., Ph.D. (UITS FIT VUT), člen
Křivka Zbyněk, Ing., Ph.D. (UIFS FIT VUT), člen
Španěl Michal, Ing., Ph.D. (UPGM FIT VUT), člen
@bachelorsthesis{FITBT25095, author = "Pavol Va\v{n}o Toth", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Identifikace znak\r{u} na hloubkov\'{e}m sn\'{i}mku pneumatiky", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2022, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/25095/" }