Detail publikace

Text-Based Web Page Classification with Use of Visual Information

BARTÍK, V. Text-Based Web Page Classification with Use of Visual Information. 2010 International Conference on Advances in Social Network Analysis and Mining. Odense: IEEE Computer Society, 2010. p. 416-420. ISBN: 978-0-7695-4138-9.
Název česky
Klasifikace webových stránek založená na textu s využitím vizuální informace
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Klíčová slova

web page classification, term weights, text classification, TF-IDF weight, visual information, visual  blocks

Abstrakt

S neustále rosoucím počtem stránek na webu je potřeba tyto stránky klasifikovat do kategorií, aby bylo možné jejich indexování a vyhledávání. Je zde popsána metoda, která využívá textovou i vizuální informaci pro reprezentaci obsahu webové stránky. Je zde popsáno několik vah pro termy, které jsou modifikacemi TF a TF-IDF. Modifikae jsou založeny na vizuálních oblastech stránky, v nichž se text nachází a jejich vizuálních vlastnostech. Na konci článku je obsaženo několik výsledků experimentů.

Rok
2010
Strany
416–420
Sborník
2010 International Conference on Advances in Social Network Analysis and Mining
ISBN
978-0-7695-4138-9
Vydavatel
IEEE Computer Society
Místo
Odense
BibTeX
@inproceedings{BUT35625,
  author="Vladimír {Bartík}",
  title="Text-Based Web Page Classification with Use of Visual Information",
  booktitle="2010 International Conference on Advances in Social Network Analysis and Mining",
  year="2010",
  pages="416--420",
  publisher="IEEE Computer Society",
  address="Odense",
  isbn="978-0-7695-4138-9"
}
Nahoru