Detail práce

Identifikace znaků na hloubkovém snímku pneumatiky

Bakalářská práce Student: Toth Vaňo Pavol Akademický rok: 2021/2022 Vedoucí: Španěl Michal, Ing., Ph.D.
Název anglicky
Identification of Characters on Depth Scans of Tires
Jazyk práce
český
Abstrakt

Táto práca sa zaoberá problémom detekcie, rozpoznania a segmentácie znakov na hĺbkovej snímke pneumatiky. V práci aplikovaný prístup horizontálne rozdelí vstupnú hĺbkovú snímku na prekrývajúce sa časti, v ktorých sú symboly detegované hlbokou neurónovou sieťou Mask R-CNN. Následným použitím algoritmu potlačenia nemaximálnych hodnôt sú zahodené duplicitné detekcie vznikajúce kvôli prekryvom. V práci je tiež predstavená modifikácia siete Mask R-CNN používajúca zdvojenú segmentačnú vetvu za účelom kvalitnejšej segmentácie symbolov s tenkými líniami a členitou maskou. Použitím navrhnutého prístupu dosiahla na pripravenej dátovej sade metrika mean average precision s IoU v intervale od 0,5 do 0,95 hodnotu 0,877 pre detekciu a 0,738 pre segmentáciu.

Klíčová slova

hĺbková snímka pneumatiky, hlboké učenie, Mask R-CNN, U-Net, segmentácia obrazu, identifikácia znakov, inštančná segmentácia, sémantická segmentácia, nerovnovážna dátová sada, zdvojená segmentačná vrstva

Ústav
Studijní program
Informační technologie
Soubory
Důvod odložení zveřejnění

Zveřejnění bakalářské práce je v souladu s ustanovením § 47b odst. 4 zákona č. 111/1998 Sb., o vysokých školách a o změně a doplnění dalších zákonů (zákon o vysokých školách), ve znění pozdějších předpisů, odloženo o 3 roky. Důvodem odložení zveřejnění je ochrana duševního vlastnictví a skutečnost, že bakalářská práce obsahuje obchodní tajemství ve smyslu příslušných ustanovení zákona č. 89/2012 Sb., občanského zákoníku.

Stav
obhájeno, hodnocení A
Obhajoba
15. června 2022
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Otázky u obhajoby
  1. Proč jste nepoužil generovaná data, která by proti stávající datové sadě měla jistě mnoho výhod?
  2. V použitých hloubkových datech by zřejmě bylo velice robustní generovat návrhy na výskyt jednotlivých symbolů nějakým konvenčním způsobem a navržené regiony pak klasifikovat neuronovou sítí. V čem by takový přístup byl ne/výhodnější než řešení celého problému naráz pomocí Faster R-CNN / Mask R-CNN?
  3. Experimenty ukazují, že použití augmentací při učení nic nepřináší. To je poněkud nezvyklé - jaké pro to máte vysvětlení?
  4. Jak to, že jsou výsledné obrázky krásně zarovnané? Chybí jakákoli rotace.
Komise
Herout Adam, prof. Ing., Ph.D. (UPGM FIT VUT), předseda
Kočí Radek, Ing., Ph.D. (UITS FIT VUT), člen
Křivka Zbyněk, Ing., Ph.D. (UIFS FIT VUT), člen
Španěl Michal, Ing., Ph.D. (UPGM FIT VUT), člen
Citace
TOTH, Vaňo. Identifikace znaků na hloubkovém snímku pneumatiky. Brno, 2022. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2022-06-15. Vedoucí práce Španěl Michal. Dostupné z: https://www-dev.fit.vutbr.cz/study/thesis/25095/
BibTeX
@bachelorsthesis{FITBT25095,
    author = "Pavol Va\v{n}o Toth",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Identifikace znak\r{u} na hloubkov\'{e}m sn\'{i}mku pneumatiky",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2022,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/25095/"
}
Nahoru