Detail publikace

Vizuální segmentace elektronických dokumentů

BURGET, R. Vizuální segmentace elektronických dokumentů. In Znalosti 2007. Ostrava: Vysoká škola báňská - technická universita Ostrava, 2007. s. 155-166. ISBN: 978-80248-1279-3.
Název anglicky
Visual Document Segmentation
Typ
článek ve sborníku konference
Jazyk
česky
Autoři
Klíčová slova

modelování dokumentů, segmentace stránek, extrakce informace, struktura dokumentu

Abstrakt

Segmentace dokumentů se zabývá detekcí vizuálního členění obsahu dokumentů a jeho reprezentací. Znalost členění obsahu umožňuje zpřesnit výsledky existujících metod zpracování dokumentů, které dosud využívaly zejména textový obsah dokumentu, jako například metody indexace a vyhledávání dokumentů, klasifikace, extrakce informace a další. V současnosti existuje několik přístupů k segmentaci dokumentů, které jsou však často omezené na konkrétní typ dokumentu či konkrétní aplikaci. V tomto příspěvku navrhujeme novou metodu, která odstraňuje některé omezující vlastnosti existujících metod a dále se zabýváme možností využití navržené metody segmentace v oblasti extrakce dat z dokumentu.

Rok
2007
Strany
155–166
Sborník
Znalosti 2007
ISBN
978-80248-1279-3
Vydavatel
Vysoká škola báňská - technická universita Ostrava
Místo
Ostrava
BibTeX
@inproceedings{BUT28579,
  author="Radek {Burget}",
  title="Vizuální segmentace elektronických dokumentů",
  booktitle="Znalosti 2007",
  year="2007",
  pages="155--166",
  publisher="Vysoká škola báňská - technická universita Ostrava",
  address="Ostrava",
  isbn="978-80248-1279-3"
}
Nahoru