Detail publikace

Generator of Synthetic Datasets for Hierarchical Sequential Pattern Mining Evaluation

ŠEBEK, M.; ZENDULKA, J. Generator of Synthetic Datasets for Hierarchical Sequential Pattern Mining Evaluation. Proceedings of the Twelfth International Conference on Informatics 2013. Košice: The University of Technology Košice, 2013. p. 289-292. ISBN: 978-80-8143-127-2.
Název česky
Generátor syntetických datových sad pro vyhodnocení dolování hierarchických sekvenčních vzorů
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Šebek Michal, Ing., Ph.D.
Zendulka Jaroslav, doc. Ing., CSc. (UIFS)
Klíčová slova

dolování sekvenčních vzorů, generátory syntetických datových sad, taxonomie

Abstrakt

Evaluace je důležitou součástí návrhu algoritmů. Algoritmy jsou obvykle evaluovány na reálných a syntetických datových sadách. Reálné datové sady jsou vhodné pro hodnocení vlastností algoritmů v praxi, ale je obtížné změnit datovou sadu tak, aby měla nějaké konkrétní statistické vlastnosti, např. počet vstupních položek. Naproti tomu, vygenerované syntetické datové sady umožňují jednoduše provádět jakékoliv změny hodnoty statistické vlastnosti datové sady při zachování všech ostatních vlastností. V příspěvku prezentujeme postup pro generování databází sekvencí s taxonomiemi pro evaluaci algoritmů pro dolování hierarchických sekvenčních vzorů.

Anotace

Evaluace je důležitou součástí návrhu algoritmů. Algoritmy jsou obvykle evaluovány na reálných a syntetických datových sadách. Reálné datové sady jsou vhodné pro hodnocení vlastností algoritmů v praxi, ale je obtížné změnit datovou sadu tak, aby měla nějaké konkrétní statistické vlastnosti, např. počet vstupních položek. Naproti tomu, vygenerované syntetické datové sady umožňují jednoduše provádět jakékoliv změny hodnoty statistické vlastnosti datové sady při zachování všech ostatních vlastností. V příspěvku prezentujeme postup pro generování databází sekvencí s taxonomiemi pro evaluaci algoritmů pro dolování hierarchických sekvenčních vzorů.

Rok
2013
Strany
289–292
Sborník
Proceedings of the Twelfth International Conference on Informatics 2013
ISBN
978-80-8143-127-2
Vydavatel
The University of Technology Košice
Místo
Košice
BibTeX
@inproceedings{BUT103555,
  author="Michal {Šebek} and Jaroslav {Zendulka}",
  title="Generator of Synthetic Datasets for Hierarchical Sequential Pattern Mining Evaluation",
  booktitle="Proceedings of the Twelfth International Conference on Informatics 2013",
  year="2013",
  pages="289--292",
  publisher="The University of Technology Košice",
  address="Košice",
  isbn="978-80-8143-127-2",
  url="https://www.fit.vut.cz/research/publication/10435/"
}
Nahoru