Detail publikace
Creating Searchable Web Page Snapshots using Semantic Technologies
Web page snapshot, Page rendering, Data extraction, RDF, SPARQL
Pro mnoho aplikací je nutné vytvářet snímky webových stránek, které přesně popisují, jak se stránka v daném okamžiku zobrazovala v prohlížeči. Ukládání původního kódu (i když zahrnuje všechny odkazované zdroje) a vytváření bitmapových snímků obrazovky má mnoho nevýhod, pokud jde o vyhledávání, prohlížení a manipulaci s takovými snímky. V tomto článku ukazujeme odlišný přístup, který pro vykreslování webových stránek využívá dálkově ovládaný webový prohlížeč. Uchováváme kompletní informace o vykreslované stránce a všech částech jejího obsahu, transformujeme je do explicitní reprezentace založené na RDF modelu, který je uložen v úložišti. Uložené modely stránek pak lze zkoumat pomocí interaktivních webových nástrojů, exportovat v různých formátech, propojovat s dalšími zdroji dat a provádět dotazy pomocí jazyka SPARQL.
@inproceedings{BUT183805,
author="Radek {Burget} and Hamza {Salem}",
title="Creating Searchable Web Page Snapshots using Semantic Technologies",
booktitle="Web Engineering - 23rd International Conference, ICWE 2023",
year="2023",
series="Lecture Notes in Computer Science",
pages="355--358",
publisher="Springer Nature Switzerland AG",
address="Alicante",
doi="10.1007/978-3-031-34444-2\{_}26",
isbn="978-3-031-34443-5",
url="https://link.springer.com/chapter/10.1007/978-3-031-34444-2_26"
}