Detail produktu
Analyzer of JavaScript calls on web pages
Vznik: 2021
Schauer Marek, Ing.
JavaScript, API, Web browser, Web crawl, Security, Privacy, Fingerprint
Software se skládá ze dvou modulů: - nástroj pro automatické procházení webových stránek a zachytávání JavaScriptových volání (dále pouze "Crawler"), - nástroj pro analýzu získaných dat a dolování informací z nich (dále pouze "Analyzátor"). Crawler (https://github.com/martinbednar/web_crawler) automaticky navštěvuje webové stránky a pomocí upraveného rozšíření Web API Manager zachytává, jaká volání JavaScriptu stránka vykonala. Jednotlivá volání jsou ukládána do databáze. Nástroj je schopný zaznamenat a uložit řádově i statisíce volání z jediné webové stránky a při spuštění nad miliónem nejnavštěvovanějších stránek získat řádově jednotky TB dat. V nástroji Crawler je možné zachytávat volání JavaScriptu s instalovaných bezpečnostním rozšířením (např. uBlock Origin). Toho bylo využito a byly tak získány dvě datové sady - jedna pro procházení s bezpečnostním rozšířením a druhá bez něho. Nástroj Analyzátor (https://github.com/martinbednar/web_crawler_data_analysis) zajišťuje zpracování nasbíraných dat, zobrazení agregovaných výsledků a významných hodnot. Díky dvěma nasbíraným datovým sadám může Analyzátor provádět porovnání volání JavaScriptu s bezpečnostním rozšířením a bez něho, což přináší odpovědi na výzkumné otázky ohledně bezpečnosti a soukromí na webu. S využitím nástroje se podařilo například zjistit, že na 250 tisících nejnavštěvovanějších webových stránek (dle seznamu Tranco) došlo s bezpečnostním rozšířením uBlock Origin k zablokování přibližně 30% ze všech volání JavaScriptu, kdy nejvíce potlačeno bylo API Range (https://developer.mozilla.org/en-US/docs/Web/API/Range). Kompletní výsledky byly publikovány na FIT cloud (https://nextcloud.fit.vutbr.cz/s/LHxP4cYaTnoNHWQ).