Detail publikace

SoftCTC-semi-supervised learning for text recognition using soft pseudo-labels

KIŠŠ, M.; HRADIŠ, M.; BENEŠ, K.; BUCHAL, P.; KULA, M. SoftCTC-semi-supervised learning for text recognition using soft pseudo-labels. International Journal on Document Analysis and Recognition, 2023, vol. 2024, no. 27, p. 177-193. ISSN: 1433-2825.
Název česky
SoftCTC - semi-supervised učení pro rozpoznávání textu pomocí měkkých pseudo-labelů
Typ
článek v časopise
Jazyk
anglicky
Autoři
URL
Klíčová slova

CTC, SoftCTC, OCR, Text recognition, Confusion networks

Abstrakt

Tento článek se zabývá semi-supervised pro sekvenční úlohy, jako je optické rozpoznávání znaků nebo automatické rozpoznávání řeči. Navrhujeme novou loss funkci - SoftCTC - která je rozšířením CTC umožňujícím zohlednit více variant transkripce najednou. To umožňuje vynechat krok filtrování založený na jistotě, který je jinak klíčovou součástí přístupů založených na pseudo-labelingu v semi-supervised učení. Účinnost naší metody demonstrujeme na náročné úloze rozpoznávání rukopisu a docházíme k závěru, že SoftCTC se vyrovná úspěšnosti zpracování pomocí velmi specificky nastaveného filtrování. SoftCTC jsme také vyhodnotili z hlediska výpočetní efektivity a dospěli jsme k závěru, že je výrazně efektivnější než naivní přístup založený na CTC pro učení na více variantách transkripce, a zveřejnili jsme naši implementaci na GPU.

Rok
2023
Strany
177–193
Časopis
International Journal on Document Analysis and Recognition, roč. 2024, č. 27, ISSN 1433-2825
Kniha
International Journal on Document Analysis and Recognition
DOI
UT WoS
001118969400001
EID Scopus
BibTeX
@article{BUT185136,
  author="Martin {Kišš} and Michal {Hradiš} and Karel {Beneš} and Petr {Buchal} and Michal {Kula}",
  title="SoftCTC-semi-supervised learning for text recognition using soft pseudo-labels",
  journal="International Journal on Document Analysis and Recognition",
  year="2023",
  volume="2024",
  number="27",
  pages="177--193",
  doi="10.1007/s10032-023-00452-9",
  issn="1433-2825",
  url="https://link.springer.com/article/10.1007/s10032-023-00452-9"
}
Nahoru