Detail publikace

Acceleration Techniques for Automated Design of Approximate Convolutional Neural Networks

PIŇOS, M.; MRÁZEK, V.; VAVERKA, F.; VAŠÍČEK, Z.; SEKANINA, L. Acceleration Techniques for Automated Design of Approximate Convolutional Neural Networks. IEEE Journal on Emerging and Selected Topics in Circuits and Systems, 2023, vol. 13, no. 1, p. 212-224. ISSN: 2156-3357.
Název česky
Akcelerační techniky pro automatizovaný návrh aproximativních konvolučních neuronových sítí
Typ
článek v časopise
Jazyk
anglicky
Autoři
URL
Klíčová slova

   - Approximate computing,    - convolutional neural network,    - neural architecture search,    - energy efficiency,    - quantization,    - acceleration

Abstrakt

Hlavním problémem spojeným s používáním aproximativních komponent, jako jsou aproximativní násobičky, v hlubokých konvolučních neuronových sítích (CNN) během procesu návrhu je nutnost jejich emulace. Ta je výpočetně nákladná kvůli nedostatečné nativní podpoře aproximativních operací v moderních CPU a GPU. Pro urychlení emulace aproximativních operací CNN na GPU navrhujeme softwarovou knihovnu TFApprox4IL rozšiřující TensorFlow o nové aproximované vrstvy. Tyto vrstvy podporují symetrické i asymetrické kvantizační režimy, aproximativní 8xN bitové násobičky emulované pomocí vyhledávacích tabulek, nový typ aproximativní vrstvy známý jako aproximativní depthwise konvoluce a trénování s ohledem na kvantizaci. Výkonnost TFApprox4IL je rozsáhle hodnocena při simulaci aproximovaných implementací sítí MobileNetV2 a ResNet na architekturách GPU Nvidia Pascal a Tesla. Kromě toho je TFApprox4IL vyhodnocován také v algoritmech vyhledávání neuronových architektur (NAS) pro automatický návrh architektur CNN, které přímo využívají aproximativní násobičky. Na dvou různých metodách NAS, EvoApproxNAS a Google Model Search (GMS), ukazujeme, jak lze aproximativní násobiče efektivně začlenit do procesu návrhu CNN. Pro odhad spotřeby energie aproximativních CNN je představen nástroj AxMultAT založený na technologiích Timeloop a Accelergy. V porovnání s vysoce optimalizovanou simulací CNN na GPU implementovanou pomocí exaktních aritmetických operací, která je k dispozici v rámci TensorFlow, je průměrná režie inference a trénování, zavedená nástrojem TFApprox4IL, 13,6× a 8,0× , v tomto pořadí, s ohledem na ResNet50V2 a MobileNetV2 CNN na datových sadách ImageNet a CIFAR-10. Tato režie se oproti předchozím metodám snížila o jeden řád.

Rok
2023
Strany
212–224
Časopis
IEEE Journal on Emerging and Selected Topics in Circuits and Systems, roč. 13, č. 1, ISSN 2156-3357
DOI
UT WoS
000965262200001
EID Scopus
BibTeX
@article{BUT180721,
  author="Michal {Piňos} and Vojtěch {Mrázek} and Filip {Vaverka} and Zdeněk {Vašíček} and Lukáš {Sekanina}",
  title="Acceleration Techniques for Automated Design of Approximate Convolutional Neural Networks",
  journal="IEEE Journal on Emerging and Selected Topics in Circuits and Systems",
  year="2023",
  volume="13",
  number="1",
  pages="212--224",
  doi="10.1109/JETCAS.2023.3235204",
  issn="2156-3357",
  url="https://ieeexplore.ieee.org/document/10011413"
}
Nahoru