Detail publikace
Vizuální segmentace elektronických dokumentů
modelování dokumentů, segmentace stránek, extrakce informace, struktura dokumentu
Segmentace dokumentů se zabývá detekcí vizuálního členění obsahu dokumentů a jeho reprezentací. Znalost členění obsahu umožňuje zpřesnit výsledky existujících metod zpracování dokumentů, které dosud využívaly zejména textový obsah dokumentu, jako například metody indexace a vyhledávání dokumentů, klasifikace, extrakce informace a další. V současnosti existuje několik přístupů k segmentaci dokumentů, které jsou však často omezené na konkrétní typ dokumentu či konkrétní aplikaci. V tomto příspěvku navrhujeme novou metodu, která odstraňuje některé omezující vlastnosti existujících metod a dále se zabýváme možností využití navržené metody segmentace v oblasti extrakce dat z dokumentu.
@inproceedings{BUT28579,
author="Radek {Burget}",
title="Vizuální segmentace elektronických dokumentů",
booktitle="Znalosti 2007",
year="2007",
pages="155--166",
publisher="Vysoká škola báňská - technická universita Ostrava",
address="Ostrava",
isbn="978-80248-1279-3"
}