Detail publikace

Automatic annotation of online articles based on visual feature classification

BURGET, R.; BURGETOVÁ, I. Automatic annotation of online articles based on visual feature classification. International Journal of Intelligent Information and Database System, 2011, vol. 5, no. 4, p. 338-360. ISSN: 1751-5858.
Název česky
Automatická anotace elektronicky publikovaných článků založená na klasifikaci vizuálních vlastností
Typ
článek v časopise
Jazyk
anglicky
Autoři
Klíčová slova

automatic annotation, online articles, page segmentation; document preprocessing, visual features, visual analysis, data mining, classification

Abstrakt

Při aplikaci tradičních metod získávání znalostí na dokumenty na WWW typicky narážíme na problém, že běžná webová stránka obsahuje kromě svého hlavního obsahu i množství dodatečných informací různých druhů. Tyto dodatečné informace, jako například navigace nebo reklama, negativně ovlivňují výsledky metod získávání znalostí, například klasifikaci obsahu. V tomto článku představujeme metodu detekce zajímavých oblastí ve stránce, která je inspirována předpokládaným přístupem lidského čtenáře. Nejprve jsou detekovány základní vizuální bloky ve stránce a následně je jejich význam odhadnut na základě jejich vizuálního stylu. V článku popisujeme použitou metodu segmentace stránek, navrhujeme způsob klasifikace bloků na základě jejich vizuálních vlastností a prezentujeme výsledky experimentů na reálných datech.

Rok
2011
Strany
338–360
Časopis
International Journal of Intelligent Information and Database System, roč. 5, č. 4, ISSN 1751-5858
DOI
EID Scopus
BibTeX
@article{BUT76405,
  author="Radek {Burget} and Ivana {Burgetová}",
  title="Automatic annotation of online articles based on visual feature classification",
  journal="International Journal of Intelligent Information and Database System",
  year="2011",
  volume="5",
  number="4",
  pages="338--360",
  doi="10.1504/IJIIDS.2011.041322",
  issn="1751-5858",
  url="https://www.fit.vut.cz/research/publication/9692/"
}
Nahoru