Detail publikace

Finetuning Is a Surprisingly Effective Domain Adaptation Baseline in Handwriting Recognition

KOHÚT, J.; HRADIŠ, M. Finetuning Is a Surprisingly Effective Domain Adaptation Baseline in Handwriting Recognition. In Document Analysis and Recognition - ICDAR 2023. Lecture Notes in Computer Science. Lecture Notes in Computer Science. San José: Springer Nature Switzerland AG, 2023. p. 269-286. ISBN: 978-3-031-41684-2. ISSN: 0302-9743.
Název česky
Efektivní dománová adaptace v rámci rozpoznávání ručně psaného písma
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

Rozpoznávání ručně psaného písma, OCR, doladění.

Abstrakt

V mnoha úlohách strojového učení je k dispozici velký obecný dataset a malý specializovaný dataset. V takových situacích lze k adaptaci obecného modelu na cílový dataset použít různé metody doménové adaptace. Ukazujeme, že v případě neuronových sítí trénovaných pro rozpoznávání ručně psaného písma pomocí CTC funguje v takových scénářích překvapivě dobře jednoduché doladěn a že je odolné proti přeladění i pro velmi malé cílové doménové datasety. Hodnotili jsme chování doladění s ohledem na velikost trénovacích dat a kvalitu předtrénované sítě, a to jak pro pisatele trénovací sady, tak pro pisatele nové. Na velkém souboru reálných dat poskytlo jemné doladění průměrné relativní zlepšení zankové chyby o 25 % při 16 textových řádcích pro nové zapisovatele a o 50 % při 256 textových řádcích.

Rok
2023
Strany
269–286
Časopis
Lecture Notes in Computer Science, roč. 14190, č. 1, ISSN 0302-9743
Sborník
Document Analysis and Recognition - ICDAR 2023
Řada
Lecture Notes in Computer Science
ISBN
978-3-031-41684-2
Vydavatel
Springer Nature Switzerland AG
Místo
San José
DOI
EID Scopus
BibTeX
@inproceedings{BUT185151,
  author="Jan {Kohút} and Michal {Hradiš}",
  title="Finetuning Is a Surprisingly Effective Domain Adaptation Baseline in Handwriting Recognition",
  booktitle="Document Analysis and Recognition - ICDAR 2023",
  year="2023",
  series="Lecture Notes in Computer Science",
  journal="Lecture Notes in Computer Science",
  volume="14190",
  number="1",
  pages="269--286",
  publisher="Springer Nature Switzerland AG",
  address="San José",
  doi="10.1007/978-3-031-41685-9\{_}17",
  isbn="978-3-031-41684-2",
  issn="0302-9743",
  url="https://pero.fit.vutbr.cz/publications"
}
Nahoru