Detail publikace
Finetuning Is a Surprisingly Effective Domain Adaptation Baseline in Handwriting Recognition
Rozpoznávání ručně psaného písma, OCR, doladění.
V mnoha úlohách strojového učení je k dispozici velký obecný dataset a malý specializovaný dataset. V takových situacích lze k adaptaci obecného modelu na cílový dataset použít různé metody doménové adaptace. Ukazujeme, že v případě neuronových sítí trénovaných pro rozpoznávání ručně psaného písma pomocí CTC funguje v takových scénářích překvapivě dobře jednoduché doladěn a že je odolné proti přeladění i pro velmi malé cílové doménové datasety. Hodnotili jsme chování doladění s ohledem na velikost trénovacích dat a kvalitu předtrénované sítě, a to jak pro pisatele trénovací sady, tak pro pisatele nové. Na velkém souboru reálných dat poskytlo jemné doladění průměrné relativní zlepšení zankové chyby o 25 % při 16 textových řádcích pro nové zapisovatele a o 50 % při 256 textových řádcích.
@inproceedings{BUT185151,
author="Jan {Kohút} and Michal {Hradiš}",
title="Finetuning Is a Surprisingly Effective Domain Adaptation Baseline in Handwriting Recognition",
booktitle="Document Analysis and Recognition - ICDAR 2023",
year="2023",
series="Lecture Notes in Computer Science",
journal="Lecture Notes in Computer Science",
volume="14190",
number="1",
pages="269--286",
publisher="Springer Nature Switzerland AG",
address="San José",
doi="10.1007/978-3-031-41685-9\{_}17",
isbn="978-3-031-41684-2",
issn="0302-9743",
url="https://pero.fit.vutbr.cz/publications"
}