Detail publikace
Accelerating the process of web page segmentation via template clustering
ZELENÝ, J.; BURGET, R. Accelerating the process of web page segmentation via template clustering. International Journal of Intelligent Information and Database System, 2016, vol. 2016, no. 2, p. 134-153. ISSN: 1751-5858.
Název česky
Zrychlení procesu segmentace webových stránek skrze shlukování šablon
Typ
článek v časopise
Jazyk
anglicky
Autoři
Zelený Jan, Ing., Ph.D.
Burget Radek, doc. Ing., Ph.D. (UIFS)
Burget Radek, doc. Ing., Ph.D. (UIFS)
Klíčová slova
VIPS, page segmentation, vision-based page segmentation, web page segmentation, web page preprocessing, segmentation performance, clustering, template, template detection
Abstrakt
V článku navrhujeme metodu pro zvýšení efektivity vizuální segmentace webových stránek. Navrhovaná metoda je založena na konceptu detekce šablon stránek a aplikuje existující segmentační algoritmy na celé shluky stránek namísto jednotlivých dokumentů. Dosažené zvýšení efektivity segmentace dokládáme expermentálním srovnáním se třemi existujícími metodami vizuální segmentace stránek.
Rok
2016
Strany
134–153
Časopis
International Journal of Intelligent Information and Database System, roč. 2016, č. 2, ISSN 1751-5858
DOI
EID Scopus
BibTeX
@article{BUT130902,
author="Jan {Zelený} and Radek {Burget}",
title="Accelerating the process of web page segmentation via template clustering",
journal="International Journal of Intelligent Information and Database System",
year="2016",
volume="2016",
number="2",
pages="134--153",
doi="10.1504/IJIIDS.2016.075424",
issn="1751-5858",
url="https://www.fit.vut.cz/research/publication/10530/"
}