Detail publikace
Unmasking the Phishermen: Phishing Domain Detection with Machine Learning and Multi-Source Intelligence
Horák Adam, Ing. (UIFS)
Polišenský Jan, Bc. (UIFS)
Jeřábek Kamil, Ing., Ph.D. (UIFS)
Ryšavý Ondřej, doc. Ing., Ph.D. (UIFS)
Phishing, doména, detekce, strojové učení, XGBoost, příznaky, DNS, RDAP, TLS,
GeoIP
V digitálním prostředí se phishingové útoky rychle staly velkou výzvou pro
kybernetickou bezpečnost a představují významná rizika pro jednotlivce
i organizace. Tento krátký článek představuje předběžný výzkum v oblasti detekce
phishingových domén. Náš přístup využívá informace o doménách z více zdrojů: DNS,
WHOIS/RDAP, certifikátů TLS a údajů GeoIP. Vytvořili jsme bohatou datovou sadu
o velikosti 15,8 GB, obsahující informace o beniních a phishingových doménách.
Z této sady jsme extrahovali vektor 80 příznaků pro trénování a testování
klasifikátorů na bázi strojového učení. V článku představujeme předběžné výsledky
s optimalizovaným klasifikátorem XGBoost, přičemž bylo dosaženo 0.9716 míry
přesnosti, 0.9540 skóre F-1 a 0.23% míry falešně pozitivních výsledků.
@inproceedings{BUT186776,
author="Radek {Hranický} and Adam {Horák} and Jan {Polišenský} and Kamil {Jeřábek} and Ondřej {Ryšavý}",
title="Unmasking the Phishermen: Phishing Domain Detection with Machine Learning and Multi-Source Intelligence",
booktitle="Proceedings of IEEE/IFIP Network Operations and Management Symposium 2024",
year="2024",
pages="1--5",
publisher="Institute of Electrical and Electronics Engineers",
address="Soul",
doi="10.1109/NOMS59830.2024.10575573",
isbn="979-8-3503-2794-6",
url="https://ieeexplore.ieee.org/document/10575573"
}