Detail publikace

Automata with Bounded Repetition in RE2

HOLÍKOVÁ, L.; HORKÝ, M.; SÍČ, J. Automata with Bounded Repetition in RE2. In Computer Aided Systems Theory - EUROCAST 2022. Lecture Notes in Computer Science. Heidelberg: Springer Verlag, 2023. p. 232-239. ISSN: 0302-9743.
Název česky
Automaty s omezeným opakováním v RE2
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Holíková Lenka, Ing., Ph.D. (UITS)
Horký Michal, Ing.
Síč Juraj, Mgr. (UITS)
Klíčová slova

RE2, regex

Abstrakt

Při vývoji softwaru má nezastupitelnou roli porovnávání regulárních výrazů (regex). Jedná se o výpočetně náročný proces, který se často aplikuje na rozsáhlé texty. Předvídatelnost jeho účinnosti má v praxi významný vliv na celkovou použitelnost softwarových aplikací. Problémem je, že standardní přístupy k regexovému porovnávání trpí vysokou složitostí v nejhorším případě. Nešťastná kombinace regexu a textu může prodloužit dobu porovnávání o řády. To může být vstupní branou pro tzv. útok odepření služby regulárním výrazem (Regular Expression Denial of Service, ReDoS), při kterém útočník způsobí odepření služby zadáním speciálně vytvořeného regexu nebo textu. Zaměříme se na jeden ze zdrojů těchto útoků, kterým jsou regexy s omezeným opakováním (např. "(ab)100"). Stručnou reprezentaci a rychlé porovnávání takových regexů lze archivovat pomocí nového automatu s počítací množinou. Představujeme implementaci párovacího algoritmu založeného na automatu počítající množiny v jazyce C++. Implementace je provedena v rámci programu RE2, což je rychlý regex matcher nejnovější generace. Provádíme experimenty na skutečných regexech. Experimenty ukazují, že implementace v rámci RE2 je rychlejší než původní implementace v jazyce C#.

Rok
2023
Strany
232–239
Časopis
Lecture Notes in Computer Science, č. 13789, ISSN 0302-9743
Sborník
Computer Aided Systems Theory - EUROCAST 2022
Vydavatel
Springer Verlag
Místo
Heidelberg
DOI
EID Scopus
BibTeX
@inproceedings{BUT185168,
  author="Lenka {Holíková} and Michal {Horký} and Juraj {Síč}",
  title="Automata with Bounded Repetition in RE2",
  booktitle="Computer Aided Systems Theory - EUROCAST 2022",
  year="2023",
  journal="Lecture Notes in Computer Science",
  number="13789",
  pages="232--239",
  publisher="Springer Verlag",
  address="Heidelberg",
  doi="10.1007/978-3-031-25312-6\{_}27",
  issn="0302-9743"
}
Nahoru