Detail publikace

Towards Writing Style Adaptation in Handwriting Recognition

KOHÚT, J.; HRADIŠ, M.; KIŠŠ, M. Towards Writing Style Adaptation in Handwriting Recognition. In Document Analysis and Recognition - ICDAR 2023. Lecture Notes in Computer Science. Lecture Notes in Computer Science. San José: Springer Nature Switzerland AG, 2023. p. 377-394. ISBN: 978-3-031-41684-2. ISSN: 0302-9743.
Název česky
Adaptace na styl písma v rámci rozpoznávání ručně psaného textu
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

Rozpoznávání ručně psaného písma, OCR, doménová adaptace, doménově závislé parametry, doladění, CTC.

Abstrakt

Jednou z výzev rozpoznávání ručně psaného písma je přepis velkého množství značně odlišných stylů psaní. Současné přístupy explicitně nevyužívají informace o stylu pisatele, což může kvůli různým nejasnostem omezovat celkovou přesnost. Zkoumáme modely s parametry závislými na pisateli, které berou identitu pisatele jako další vstup. Navrhované modely lze trénovat na datasetech s oddíly, které pravděpodobně napsal jeden autor (např. jeden dopis, deník nebo kronika). Navrhujeme Writer Style Block (WSB), adaptivní nomralizační vrstvu podmíněnou naučenými embeddingy oddílů. Experimentovali jsme s různým umístěním a nastavením WSB a předtrénovanými embeddingy. Ukázali jsme, že náš přístup překonává základní přístup bez WSB pro pisatele trénovací sady a že je možné odhadnout embeddingy pro pisovatele nové. Adaptace na nové pisatele pomocí jednoduchého doladění však poskytuje vyšší přesnost při podobných výpočetních nárocích. Navržený přístup by měl být dále zkoumán z hlediska stability trénování a regularizace, aby bylo možné překonat jednoduché doladění.

Rok
2023
Strany
377–394
Časopis
Lecture Notes in Computer Science, roč. 14190, č. 1, ISSN 0302-9743
Sborník
Document Analysis and Recognition - ICDAR 2023
Řada
Lecture Notes in Computer Science
ISBN
978-3-031-41684-2
Vydavatel
Springer Nature Switzerland AG
Místo
San José
DOI
EID Scopus
BibTeX
@inproceedings{BUT185150,
  author="Jan {Kohút} and Michal {Hradiš} and Martin {Kišš}",
  title="Towards Writing Style Adaptation in Handwriting Recognition",
  booktitle="Document Analysis and Recognition - ICDAR 2023",
  year="2023",
  series="Lecture Notes in Computer Science",
  journal="Lecture Notes in Computer Science",
  volume="14190",
  number="1",
  pages="377--394",
  publisher="Springer Nature Switzerland AG",
  address="San José",
  doi="10.1007/978-3-031-41685-9\{_}24",
  isbn="978-3-031-41684-2",
  issn="0302-9743",
  url="https://pero.fit.vutbr.cz/publications"
}
Nahoru