Detail publikace
Unmasking the Phishermen: Phishing Domain Detection with Machine Learning and Multi-Source Intelligence
Horák Adam, Ing. (UIFS FIT VUT)
Polišenský Jan, Bc. (FIT VUT)
Jeřábek Kamil, Ing., Ph.D. (UIFS FIT VUT)
Ryšavý Ondřej, doc. Ing., Ph.D. (UIFS FIT VUT)
Phishing, doména, detekce, strojové učení, XGBoost, příznaky, DNS, RDAP, TLS, GeoIP
V digitálním prostředí se phishingové útoky rychle staly velkou výzvou pro kybernetickou bezpečnost a představují významná rizika pro jednotlivce i organizace. Tento krátký článek představuje předběžný výzkum v oblasti detekce phishingových domén. Náš přístup využívá informace o doménách z více zdrojů: DNS, WHOIS/RDAP, certifikátů TLS a údajů GeoIP. Vytvořili jsme bohatou datovou sadu o velikosti 15,8 GB, obsahující informace o beniních a phishingových doménách. Z této sady jsme extrahovali vektor 80 příznaků pro trénování a testování klasifikátorů na bázi strojového učení. V článku představujeme předběžné výsledky s optimalizovaným klasifikátorem XGBoost, přičemž bylo dosaženo 0.9716 míry přesnosti, 0.9540 skóre F-1 a 0.23% míry falešně pozitivních výsledků.
@INPROCEEDINGS{FITPUB13073, author = "Radek Hranick\'{y} and Adam Hor\'{a}k and Jan Poli\v{s}ensk\'{y} and Kamil Je\v{r}\'{a}bek and Ond\v{r}ej Ry\v{s}av\'{y}", title = "Unmasking the Phishermen: Phishing Domain Detection with Machine Learning and Multi-Source Intelligence", pages = "1--5", booktitle = "Proceedings of IEEE/IFIP Network Operations and Management Symposium 2024", year = 2024, location = "Soul, KR", publisher = "Institute of Electrical and Electronics Engineers", ISBN = "979-8-3503-2794-6", language = "english", url = "https://www.fit.vut.cz/research/publication/13073" }