Detail publikace
A Reality Check on Inference at Mobile Networks Edge
Kocour Martin, Ing. (UPGM)
RAMAN, A.
LEONTIADIS, I.
Luque Jordi (FIT)
SASTRY, N.
NUNEZ-MARTINEZ, L.
PERINO, D.
PERALES, C.
decentralizovaný výpočet, výpočet, umělá inteligence
Edge computing je považován za klíčový prostředek k nasazení platforem umělé inteligence pro poskytování aplikací v reálném čase, jako jsou AR / VR nebo kognitivní asistence. Předchozí práce ukazují, že počítačové schopnosti nasazené velmi blízko k uživateli mohou skutečně snížit čekací dobu těchto interaktivních aplikací. Hlavní překážkou výkonu však zůstává v provozu strojového učení. V tomto článku zpochybňujeme některé předpoklady těchto prací, jako je umístění v síti, kde je implementováno hranové výpočty, a považujeme softwarové architektury v rámci několika oblíbených úloh strojového učení. Naše experimentální hodnocení ukazuje, že po vyladění výkonu, které využívá pokroků v algoritmech hlubokého učení a hardwaru, je latence sítě nyní hlavním problémovým bodem pro výkonnost jednotlivých aplikací. Rovněž hlásíme, že nasazení výpočetních schopností v prvním síťovém uzlu stále poskytuje snížení latence, ale celkově to není vyžadováno všemi aplikacemi. Na základě našich zjištění sledujeme požadavky a načrtneme návrh adaptivního výzkumu pro obecnou inferenci strojového učení napříč hranami.
@inproceedings{BUT156850,
author="CARTAS, A. and KOCOUR, M. and RAMAN, A. and LEONTIADIS, I. and LUQUE, J. and SASTRY, N. and NUNEZ-MARTINEZ, L. and PERINO, D. and PERALES, C.",
title="A Reality Check on Inference at Mobile Networks Edge",
booktitle="Proceedings of the 2nd ACM International Workshop on Edge Systems, Analytics and Networking (EDGESYS '19)",
year="2019",
pages="54--59",
publisher="Association for Computing Machinery",
address="Dressden",
doi="10.1145/3301418.3313946",
isbn="978-1-4503-6275-7",
url="https://dl.acm.org/citation.cfm?doid=3301418.3313946"
}