Detail publikace
SoftCTC-semi-supervised learning for text recognition using soft pseudo-labels
Hradiš Michal, Ing., Ph.D. (UPGM)
Beneš Karel, Ing. (UPGM)
Buchal Petr, Ing.
Kula Michal, Ing., Ph.D. (UPGM)
CTC, SoftCTC, OCR, Text recognition, Confusion networks
Tento článek se zabývá semi-supervised pro sekvenční úlohy, jako je optické rozpoznávání znaků nebo automatické rozpoznávání řeči. Navrhujeme novou loss funkci - SoftCTC - která je rozšířením CTC umožňujícím zohlednit více variant transkripce najednou. To umožňuje vynechat krok filtrování založený na jistotě, který je jinak klíčovou součástí přístupů založených na pseudo-labelingu v semi-supervised učení. Účinnost naší metody demonstrujeme na náročné úloze rozpoznávání rukopisu a docházíme k závěru, že SoftCTC se vyrovná úspěšnosti zpracování pomocí velmi specificky nastaveného filtrování. SoftCTC jsme také vyhodnotili z hlediska výpočetní efektivity a dospěli jsme k závěru, že je výrazně efektivnější než naivní přístup založený na CTC pro učení na více variantách transkripce, a zveřejnili jsme naši implementaci na GPU.
@article{BUT185136,
author="Martin {Kišš} and Michal {Hradiš} and Karel {Beneš} and Petr {Buchal} and Michal {Kula}",
title="SoftCTC-semi-supervised learning for text recognition using soft pseudo-labels",
journal="International Journal on Document Analysis and Recognition",
year="2023",
volume="2024",
number="27",
pages="177--193",
doi="10.1007/s10032-023-00452-9",
issn="1433-2825",
url="https://link.springer.com/article/10.1007/s10032-023-00452-9"
}