Detail publikace
Towards Writing Style Adaptation in Handwriting Recognition
Hradiš Michal, Ing., Ph.D. (UPGM FIT VUT)
Kišš Martin, Ing. (UPGM FIT VUT)
Rozpoznávání ručně psaného písma, OCR, doménová adaptace, doménově závislé parametry, doladění, CTC.
Jednou z výzev rozpoznávání ručně psaného písma je přepis velkého množství značně odlišných stylů psaní. Současné přístupy explicitně nevyužívají informace o stylu pisatele, což může kvůli různým nejasnostem omezovat celkovou přesnost. Zkoumáme modely s parametry závislými na pisateli, které berou identitu pisatele jako další vstup. Navrhované modely lze trénovat na datasetech s oddíly, které pravděpodobně napsal jeden autor (např. jeden dopis, deník nebo kronika). Navrhujeme Writer Style Block (WSB), adaptivní nomralizační vrstvu podmíněnou naučenými embeddingy oddílů. Experimentovali jsme s různým umístěním a nastavením WSB a předtrénovanými embeddingy. Ukázali jsme, že náš přístup překonává základní přístup bez WSB pro pisatele trénovací sady a že je možné odhadnout embeddingy pro pisovatele nové. Adaptace na nové pisatele pomocí jednoduchého doladění však poskytuje vyšší přesnost při podobných výpočetních nárocích. Navržený přístup by měl být dále zkoumán z hlediska stability trénování a regularizace, aby bylo možné překonat jednoduché doladění.
@INPROCEEDINGS{FITPUB12963, author = "Jan Koh\'{u}t and Michal Hradi\v{s} and Martin Ki\v{s}\v{s}", title = "Towards Writing Style Adaptation in Handwriting Recognition", pages = "377--394", booktitle = "Document Analysis and Recognition - ICDAR 2023", series = "Lecture Notes in Computer Science", journal = "Lecture Notes in Computer Science", volume = 14190, number = 1, year = 2023, location = "San Jos\'{e}, US", publisher = "Springer Nature Switzerland AG", ISBN = "978-3-031-41684-2", ISSN = "0302-9743", doi = "10.1007/978-3-031-41685-9\_24", language = "english", url = "https://www.fit.vut.cz/research/publication/12963" }