Detail publikace
Measuring Web Page Similarity Based on Textual and Visual Properties
Web page similarity, clustering, vector space model, vector distance, term weighting, visual blocks.
Měření podobnosti webových stránek je důležitou úlohou v oblasti dolování na webu a vyhledávání informací. Tento příspěvek představuje metodu měření podobnosti webových stránek, která uvažuje textové i vizuální vlastnosti stránek. Textové vlastnosti jsou popsány pomocí modifikovaného vektorového modelu. Vizuální vlastnosti jsou získány pomocí segmentace stránky, která rozdělí stránku na vizuální bloky, jejichž vlastnosti jsou uloženy do vektoru vizuálních oblastí. Oba tyto vektory jsou poté využity pro výpočet celkové podobnosti stránek. Metoda je detailně popsána a jsou zde představeny výsledky několika experimentů.
@inproceedings{BUT76500,
author="Vladimír {Bartík}",
title="Measuring Web Page Similarity Based on Textual and Visual Properties",
booktitle="The 11th International Conference on Artificial Intelligence and Soft Computing",
year="2012",
series="Lecture Notes in Artificial Intelligence, Vol. 7268",
journal="Lecture Notes in Computer Science",
number="7268",
pages="13--21",
publisher="Springer Verlag",
address="Zakopane",
isbn="978-3-642-29349-8",
issn="0302-9743",
url="https://www.fit.vut.cz/research/publication/9850/"
}