Detail publikace
Fast Linear Algebra on GPU
Smrž Pavel, doc. RNDr., Ph.D. (UPGM)
GPU; parallel reduction; linear algebra; BLAS; OpenCL; CUDA
GPU jsou úspěšně využívané k akceleraci mnoha matematických funkcí a knihoven. Běžnou limitací těchto knihoven je minimální velikost problému, nutná k dosažení podstatného zrychlení, v porovnání s CPU ekvivalentem. Toto kritérium může pro mnoho aplikací znamenat nemožnost jejich implementace na GPU. Je však možné jej obejít pomocí slučování operací do dávek tak, aby GPU mělo dostatek dat k efektivnímu zpracování. V této publikaci navrhujeme rychlou OpenCL implementaci dvou základních vektorových funkcí - redukci a násobení skalárem. Rychlost implementace byla změřena na dvou dnes nejpoužívanějších typech GPU (Tesla a Fermi). V porovnání s dnešním de-facto standardem, knihovnou CUBLAS, je naše implementace výrazně rychlejší.
@inproceedings{BUT96982,
author="Lukáš {Polok} and Pavel {Smrž}",
title="Fast Linear Algebra on GPU",
booktitle="IEEE conference proceedings",
year="2012",
pages="1--6",
publisher="IEEE Computer Society",
address="Liverpool",
isbn="978-0-7695-4749-7",
url="https://www.fit.vut.cz/research/publication/10039/"
}