Detail publikace

Multi-level Sequence Mining Based on GSP

ŠEBEK, M.; HLOSTA, M.; KUPČÍK, J.; ZENDULKA, J.; HRUŠKA, T. Multi-level Sequence Mining Based on GSP. Acta Electrotechnica et Informatica, 2012, vol. 2012, no. 2, p. 31-38. ISSN: 1335-8243.
Název česky
Dolování víceúrovňových sekvenčních vzorů založené na GSP
Typ
článek v časopise
Jazyk
anglicky
Autoři
Šebek Michal, Ing., Ph.D.
Hlosta Martin, Ing., Ph.D.
Kupčík Jan, Ing.
Zendulka Jaroslav, doc. Ing., CSc. (UIFS)
Hruška Tomáš, prof. Ing., CSc. (UIFS)
Klíčová slova

dolování víceúrovňových sekvenčních vzorů, GSP, taxonomie

Abstrakt

Dolování sekvenčních vzorů je důležitý problém v oblasti dolování z dat, na jehož řešení byla publikována řada algoritmů a optimalizačních technik. GSP, který je jednám z těchto algoritmů, může být využit k dolování sekvenčních vzorů s doplňujícími omezeními. V tomto článku navrhujeme nový algoritmus pro dolování víceúrovňových sekvenčních vzorů založený na GSP. Myšlenka spočívá v tom, že pokud se ve vzoru objeví obecnější prvek, vzor bude mít větší nebo alespoň stejnou podporu než vzor, který by obsahoval příslušný specifičtější prvek. Avšak příliš obecné vzory nejsou zajímavé pro uživatele. Náš algoritmus zobecňování používá selektivní metodu založenou na informační hodnotě vzorů. Umožňuje tak vydolovat více vzorů při stejné hodnotě minimální podpory a objevit nové potenciálně užitečné vzory.

Rok
2012
Strany
31–38
Časopis
Acta Electrotechnica et Informatica, roč. 2012, č. 2, ISSN 1335-8243
DOI
BibTeX
@article{BUT96928,
  author="Michal {Šebek} and Martin {Hlosta} and Jan {Kupčík} and Jaroslav {Zendulka} and Tomáš {Hruška}",
  title="Multi-level Sequence Mining Based on GSP",
  journal="Acta Electrotechnica et Informatica",
  year="2012",
  volume="2012",
  number="2",
  pages="31--38",
  doi="10.2478/v10198-012-0012-8",
  issn="1335-8243",
  url="https://www.fit.vut.cz/research/publication/9874/"
}
Nahoru