Detail publikace
Pattern Matching in YARA: Improved Aho-Corasick Algorithm
Algoritmus Aho-Corasickové, vyhledávání vzorů, regulární výrazy, YARA
YARA je nástroj pro vyhledávání vzorů používaný specialisty na škodlivý software po celém světě. YARA dokáže skenovat soubory, ale i paměť procesů. Dovoluje definovat textové řetězce, hexadecimální řetězce a regulární výrazy. Použití regulárních výrazů je však omezeno kvůli obavám ze zpomalování procesu skenování. V tomto článku analyzujeme pravdou podstatu regulárních výrazů v YARA nástroji a její implementaci. Odhalili jsme několik příčin, které doopravdy mohou způsobit snížení rychlosti skenování plynoucí z vlastností použitého algoritmu, Aho-Corasickové. Navrhli jsme novou podobu algoritmu a implementovali ji do originální verze nástroje. Experimenty představené v tomto článku potvrdili, že rychlost skenování s regulárními výrazy může být vskutku zlepšena.
@article{BUT171395,
author="Dominika {Regéciová} and Dušan {Kolář} and Marek {Milkovič}",
title="Pattern Matching in YARA: Improved Aho-Corasick Algorithm",
journal="IEEE Access",
year="2021",
volume="9",
number="1",
pages="62857--62866",
doi="10.1109/ACCESS.2021.3074801",
issn="2169-3536",
url="https://ieeexplore.ieee.org/document/9410267"
}