Detail publikace

Isomorphic mapping of DOM trees for Cluster-Based Page Segmentation

ZELENÝ, J.; BURGET, R. Isomorphic mapping of DOM trees for Cluster-Based Page Segmentation. Proceedings of the Twelfth International Conference on Informatics INFORMATICS'2013. Spišská Nová Ves: The University of Technology Košice, 2013. p. 256-261. ISBN: 978-80-8143-127-2.
Název česky
Izomorfní mapování DOM stromů pro segmentaci webových stránek
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Zelený Jan, Ing., Ph.D.
Burget Radek, doc. Ing., Ph.D. (UIFS)
Klíčová slova

vision-based page segmentation, cache, template detection, cluster-based page segmentation, DOM, tree mapping

Abstrakt

V naší předchozí práce jsme implementovali metodu pro rychlou a přesnou segmentaci webových stránek. V této publikaci navrhujeme doplňkový algoritmus a datové struktury, které rozšiřují původní implementaci. Toto rozšíření se zaměřuje na izomorfní mapování DOM stromů. Našim hlavním cílem je zvýšení robustnosti systému při zachování jeho původní efektivity. Abychom prokázali kvalitu nového návrhu, poskytujeme také výsledky experimentálního ověření našeho algoritmu.

Rok
2013
Strany
256–261
Sborník
Proceedings of the Twelfth International Conference on Informatics INFORMATICS'2013
ISBN
978-80-8143-127-2
Vydavatel
The University of Technology Košice
Místo
Spišská Nová Ves
BibTeX
@inproceedings{BUT103543,
  author="Jan {Zelený} and Radek {Burget}",
  title="Isomorphic mapping of DOM trees for Cluster-Based Page Segmentation",
  booktitle="Proceedings of the Twelfth International Conference on Informatics INFORMATICS'2013",
  year="2013",
  pages="256--261",
  publisher="The University of Technology Košice",
  address="Spišská Nová Ves",
  isbn="978-80-8143-127-2",
  url="https://www.fit.vut.cz/research/publication/10414/"
}
Nahoru