Detail publikace
Towards Writing Style Adaptation in Handwriting Recognition
Rozpoznávání ručně psaného písma, OCR, doménová adaptace, doménově závislé parametry, doladění, CTC.
Jednou z výzev rozpoznávání ručně psaného písma je přepis velkého množství značně odlišných stylů psaní. Současné přístupy explicitně nevyužívají informace o stylu pisatele, což může kvůli různým nejasnostem omezovat celkovou přesnost. Zkoumáme modely s parametry závislými na pisateli, které berou identitu pisatele jako další vstup. Navrhované modely lze trénovat na datasetech s oddíly, které pravděpodobně napsal jeden autor (např. jeden dopis, deník nebo kronika). Navrhujeme Writer Style Block (WSB), adaptivní nomralizační vrstvu podmíněnou naučenými embeddingy oddílů. Experimentovali jsme s různým umístěním a nastavením WSB a předtrénovanými embeddingy. Ukázali jsme, že náš přístup překonává základní přístup bez WSB pro pisatele trénovací sady a že je možné odhadnout embeddingy pro pisovatele nové. Adaptace na nové pisatele pomocí jednoduchého doladění však poskytuje vyšší přesnost při podobných výpočetních nárocích. Navržený přístup by měl být dále zkoumán z hlediska stability trénování a regularizace, aby bylo možné překonat jednoduché doladění.
@inproceedings{BUT185150,
author="Jan {Kohút} and Michal {Hradiš} and Martin {Kišš}",
title="Towards Writing Style Adaptation in Handwriting Recognition",
booktitle="Document Analysis and Recognition - ICDAR 2023",
year="2023",
series="Lecture Notes in Computer Science",
journal="Lecture Notes in Computer Science",
volume="14190",
number="1",
pages="377--394",
publisher="Springer Nature Switzerland AG",
address="San José",
doi="10.1007/978-3-031-41685-9\{_}24",
isbn="978-3-031-41684-2",
issn="0302-9743",
url="https://pero.fit.vutbr.cz/publications"
}