Detail publikace
Automatic annotation of online articles based on visual feature classification
automatic annotation, online articles, page segmentation; document preprocessing, visual features, visual analysis, data mining, classification
Při aplikaci tradičních metod získávání znalostí na dokumenty na WWW typicky narážíme na problém, že běžná webová stránka obsahuje kromě svého hlavního obsahu i množství dodatečných informací různých druhů. Tyto dodatečné informace, jako například navigace nebo reklama, negativně ovlivňují výsledky metod získávání znalostí, například klasifikaci obsahu. V tomto článku představujeme metodu detekce zajímavých oblastí ve stránce, která je inspirována předpokládaným přístupem lidského čtenáře. Nejprve jsou detekovány základní vizuální bloky ve stránce a následně je jejich význam odhadnut na základě jejich vizuálního stylu. V článku popisujeme použitou metodu segmentace stránek, navrhujeme způsob klasifikace bloků na základě jejich vizuálních vlastností a prezentujeme výsledky experimentů na reálných datech.
@article{BUT76405,
author="Radek {Burget} and Ivana {Burgetová}",
title="Automatic annotation of online articles based on visual feature classification",
journal="International Journal of Intelligent Information and Database System",
year="2011",
volume="5",
number="4",
pages="338--360",
doi="10.1504/IJIIDS.2011.041322",
issn="1751-5858",
url="https://www.fit.vut.cz/research/publication/9692/"
}