Detail publikace

TS-Net: OCR Trained to Switch Between Text Transcription Styles

KOHÚT, J.; HRADIŠ, M. TS-Net: OCR Trained to Switch Between Text Transcription Styles. In Lladós J., Lopresti D., Uchida S. (eds) Document Analysis and Recognition - ICDAR 2021. Lecture Notes in Computer Science. Lecture Notes in Computer Science. Lausanne: Springer Nature Switzerland AG, 2021. p. 478-493. ISBN: 978-3-030-86336-4. ISSN: 0302-9743.
Název česky
TS-Net: OCR pro přepínání stylu přepisu
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
URL
Klíčová slova

Transcription styles, Adaptive instance normalization, Text recognition, Neural networks, CTC

Abstrakt

Více přepisovatelů vytváří přepisy v nejednotných stylech přepisu.  To představuje problém pro trénování konzistentních systémů neuronových sítí pro rozpoznávání textu. Navrhujeme Transcription Style Block (TSB), který se dokáže naučit přepínat mezi více styly přepisu bez explicitní znalosti pravidel přepisu. TSB je adaptivní normalizace podmíněná identifikátory transkripčních stylů, např. čísly dokumentů nebo jmény přepisovatelů, a lze ji přidat do jakékoli standardní sítě pro rozpoznávání textu.  Ukazujeme, že TSB je robustní vůči počtu a složitosti transkripčních stylů a nezhoršuje výkonnost rozpoznávání textu. Díky časově a datově efektivní adaptaci na nový styl přepisu jsme dosáhli až 77\% relativního snížení chyby znaků na testovací sadě ve srovnání se sítí bez TSB.

Rok
2021
Strany
478–493
Časopis
Lecture Notes in Computer Science, roč. 12824, č. 1, ISSN 0302-9743
Sborník
Lladós J., Lopresti D., Uchida S. (eds) Document Analysis and Recognition - ICDAR 2021
Řada
Lecture Notes in Computer Science
ISBN
978-3-030-86336-4
Vydavatel
Springer Nature Switzerland AG
Místo
Lausanne
DOI
UT WoS
000711880100032
EID Scopus
BibTeX
@inproceedings{BUT169806,
  author="Jan {Kohút} and Michal {Hradiš}",
  title="TS-Net: OCR Trained to Switch Between Text Transcription Styles",
  booktitle="Lladós J., Lopresti D., Uchida S. (eds) Document Analysis and Recognition - ICDAR 2021",
  year="2021",
  series="Lecture Notes in Computer Science",
  journal="Lecture Notes in Computer Science",
  volume="12824",
  number="1",
  pages="478--493",
  publisher="Springer Nature Switzerland AG",
  address="Lausanne",
  doi="10.1007/978-3-030-86337-1\{_}32",
  isbn="978-3-030-86336-4",
  issn="0302-9743",
  url="https://pero.fit.vutbr.cz/publications"
}
Nahoru