Detail produktu
Lemmiwinks framework, MozArch application
Vznik: 2018
Veselý Vladimír, Ing., Ph.D. (UIFS)
Web archiving, Mozilla Archive Format, Web scraping, Web indexing, Lemmiwinks, MultiFunctional Index Scraping Tool
Mnoho právních institucí vyžaduje důkazní břemeno týkající se webového obsahu. Tyto nástroje se zabývájí problémem spojeným s automatizací webové rekonstrukce a webovou archivací. Hlavním cílem je poskytnout řešení s s otevřeným zdrojovým kódem, které uspokojí právní instituce s jejich požadavky. Tato práce představuje dva hlavní produkty. První je framework Lemmiwinks, který je základním stavebním kamenem pro vývoj aplikací na extrakci a archivaci webových stránek. Druhým produktem je MozArch, prototyp ukazující využití frameworku. Výstupem MozArchi je soubor ve formátu MAFF, který obsahuje zrekonstruovanou webovou stránku, screenshot webové stránky a tabulku meta-informací jako jsou IP adresy, porty a časové razítko.
Zdrojové kódy k Lemmiwinks frameworku: https://github.com/nesfit/Lemmiwinks Zdrojové kódy k MozArchive aplikaci: https://github.com/nesfit/mozarch
Softwary jsou nabízené pod MIT licencí