Detail publikace

Towards Deep Learning-based 6D Bin Pose Estimation in 3D Scans

GAJDOŠECH, L.; KOCUR, V.; STUCHLÍK, M.; HUDEC, L.; MADARAS, M. Towards Deep Learning-based 6D Bin Pose Estimation in 3D Scans. In Proceedings of the 17th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications - Volume 4 VISAPP: VISAPP. Setubal: SciTePress - Science and Technology Publications, 2022. p. 545-552. ISBN: 978-989-758-555-5.
Název česky
Směrem k bázi hlubokého učení 6D BIN založeného na 3D skenování
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Gajdošech Lukáš, Mgr.
Kocur Viktor, Ing., Ph.D.
Stuchlík Martin, Mgr.
Hudec Lukáš, Ing., Ph.D.
Madaras Martin, Ing., Ph.D.
URL
Klíčová slova

Počítačové vidění, odhad pozice Bin, odhad 6D pozice, hluboké učení, kloudování bodů

Abstrakt

Automatizovaný robotický systém musí být co nejrobustnější a obecně bezpečný proti selhání a zároveň musí mít relativně vysokou přesnost a opakovatelnost. I když se metody založené na hlubokém učení stávají standardem výzkumu, jak přistupovat k úlohám 3D skenování a zpracování obrazu, průmyslový standard pro zpracování těchto dat je stále založen na analytické bázi. Náš článek tvrdí, že analytické metody jsou méně robustní a obtížnější pro testování, aktualizaci a údržbu. Tento článek se zaměřuje na konkrétní úlohu 6D odhadu pozice koše ve 3D skenech. Proto představujeme vysoce kvalitní datovou sadu složenou ze syntetických dat a skutečných skenů zachycených skenerem se strukturovaným světlem s přesnými anotacemi. Navíc navrhujeme dvě různé metody pro odhad pozice 6D bin, analytickou metodu jako průmyslový standard a metodu založenou na základních datech. Oba přístupy jsou křížově hodnoceny a naše experimenty ukazují, že rozšíření tréninku na skutečných skenech o syntetická data zlepšuje náš navrhovaný neurální model řízený daty. Tento poziční dokument je předběžný, protože navrhované metody jsou trénovány a vyhodnocovány na relativně malém počátečním souboru dat, který plánujeme v budoucnu rozšířit.

Rok
2022
Strany
545–552
Sborník
Proceedings of the 17th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications - Volume 4 VISAPP: VISAPP
Konference
17th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications (VISIGRAPP), Online, AT
ISBN
978-989-758-555-5
Vydavatel
SciTePress - Science and Technology Publications
Místo
Setubal
DOI
UT WoS
000777569400058
BibTeX
@inproceedings{BUT182954,
  author="Lukáš {Gajdošech} and Viktor {Kocur} and Martin {Stuchlík} and Lukáš {Hudec} and Martin {Madaras}",
  title="Towards Deep Learning-based 6D Bin Pose Estimation in 3D Scans",
  booktitle="Proceedings of the 17th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications - Volume 4 VISAPP: VISAPP",
  year="2022",
  pages="545--552",
  publisher="SciTePress - Science and Technology Publications",
  address="Setubal",
  doi="10.5220/0010878200003124",
  isbn="978-989-758-555-5",
  url="https://www.scitepress.org/Link.aspx?doi=10.5220/0010878200003124"
}
Nahoru