Detail publikace
Scheduling Decisions in Stream Processing on Heterogeneous Clusters
rozvrhování, posouzení zdrojů, měření výkonnosti, heterogenní clustery, zpracování proudů, Apache Storm
Paradigma zpracování proudů dat vzniklo kvůli potřebě řešit známé problémy široce používaného MapReduce paradigma pro zpracování velkých objemů dat (Big Data). Navíc, heterogenita clusterů zpracovávajících data v prostředí výpočetních center, ať už úmyslná či neúmyslná, začíná být běžným jevem a přináší další problémy. Tento příspěvek pojednává o problémech rozhodování při rozvrhování zpracování proudů v heterogenních clusterech. Příspěvek přináší přehled současného stavu poznání v oblasti zpracování proudů dat v heterogenních clusterech se zaměřením na alokaci zdrojů a na rozvrhování. V příspěvku jsou diskutovány základní rozhodnutí při rozvrhování zpracování proudů dat v heterogenních clusterech a jednoduché rozvrhování je demonstrováno na ukázkové aplikaci. Příspěvek představuje návrh nového plánovače pro rozvrhování pro rámce zpracovávající proudy dat v heterogenních clusterech. Plánovač využívá informace zadané návrhářem clusteru pro zpracování proudů dat a informace získané měřením výkonnosti výsledného clusteru za jeho běhu tak, aby bylo dosaženo optimálního rozvržení zdrojů mezi aplikace bežící na clusteru a optimální vytížení celého clusteru.
@inproceedings{BUT111552,
author="Marek {Rychlý} and Petr {Škoda} and Pavel {Smrž}",
title="Scheduling Decisions in Stream Processing on Heterogeneous Clusters",
booktitle="2014 Eighth International Conference on Complex, Intelligent and Software Intensive Systems",
year="2014",
pages="614--619",
publisher="IEEE Computer Society",
address="Birmingham",
doi="10.1109/CISIS.2014.94",
isbn="978-1-4799-4325-8",
url="http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6915583"
}