Detail publikace

Automatic Web Document Restructuring Based on Visual Information Analysis

BURGET, R. Automatic Web Document Restructuring Based on Visual Information Analysis. In Advances in Intelligent Web Mastering - 2, Proceedings of the 6th Atlantic Web Intelligence Conference - AWIC'2009. Advances in Intelligent and Soft Computing , Vol. 67. Prague: Springer Verlag, 2010. p. 61-70. ISBN: 978-3-642-10686-6.
Název česky
Automatická úprava struktury webových dokumentů na základě analýzy vizuální informace
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Klíčová slova

document restructuring, page analysis, page segmentation, block importance

Abstrakt

Mnoho dokumentů přístupných přes současný web má poměrně složitou strukturu, která umožňuje prezentovat různé druhy informací. Kromě hlavního obsahu proto stránky obvykle obsahují záhlaví a zápatí, navigační část a další druhy dodatečných informací. Pro mnoho aplikací, jako například indexování dokumentů nebo jejich prohlížení na speciálních zařízeních je vhodné, aby v HTML kódu dokumentu hlavní obsah předcházel ostatní informace. V tomto příspěvku představujeme metodu předzpracování dokumentů, která automaticky upraví strukturu dokumentu podle tohoto kritéria. Metoda využívá algoritmus segmentace stránek pro detekci základních bloků stránky. Relevance jednotlivých bloků je pak odhadnuta na základě jejich vizuálních vlastností.

Rok
2010
Strany
61–70
Sborník
Advances in Intelligent Web Mastering - 2, Proceedings of the 6th Atlantic Web Intelligence Conference - AWIC'2009
Řada
Advances in Intelligent and Soft Computing , Vol. 67
ISBN
978-3-642-10686-6
Vydavatel
Springer Verlag
Místo
Prague
DOI
EID Scopus
BibTeX
@inproceedings{BUT30224,
  author="Radek {Burget}",
  title="Automatic Web Document Restructuring Based on Visual Information Analysis",
  booktitle="Advances in Intelligent Web Mastering - 2, Proceedings of the 6th Atlantic Web Intelligence Conference - AWIC'2009",
  year="2010",
  series="Advances in Intelligent and Soft Computing , Vol. 67",
  pages="61--70",
  publisher="Springer Verlag",
  address="Prague",
  doi="10.1007/978-3-642-10687-3\{_}6",
  isbn="978-3-642-10686-6"
}
Nahoru