Detail publikace
Text-Based Web Page Classification with Use of Visual Information
BARTÍK, V. Text-Based Web Page Classification with Use of Visual Information. 2010 International Conference on Advances in Social Network Analysis and Mining. Odense: IEEE Computer Society, 2010. p. 416-420. ISBN: 978-0-7695-4138-9.
Název česky
Klasifikace webových stránek založená na textu s využitím vizuální informace
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Bartík Vladimír, Ing., Ph.D.
(UIFS)
Klíčová slova
web page classification, term weights, text classification, TF-IDF weight, visual information, visual blocks
Abstrakt
S neustále rosoucím počtem stránek na webu je potřeba tyto stránky klasifikovat do kategorií, aby bylo možné jejich indexování a vyhledávání. Je zde popsána metoda, která využívá textovou i vizuální informaci pro reprezentaci obsahu webové stránky. Je zde popsáno několik vah pro termy, které jsou modifikacemi TF a TF-IDF. Modifikae jsou založeny na vizuálních oblastech stránky, v nichž se text nachází a jejich vizuálních vlastnostech. Na konci článku je obsaženo několik výsledků experimentů.
Rok
2010
Strany
416–420
Sborník
2010 International Conference on Advances in Social Network Analysis and Mining
ISBN
978-0-7695-4138-9
Vydavatel
IEEE Computer Society
Místo
Odense
BibTeX
@inproceedings{BUT35625,
author="Vladimír {Bartík}",
title="Text-Based Web Page Classification with Use of Visual Information",
booktitle="2010 International Conference on Advances in Social Network Analysis and Mining",
year="2010",
pages="416--420",
publisher="IEEE Computer Society",
address="Odense",
isbn="978-0-7695-4138-9"
}