Detail publikace

Estimating Extreme 3D Image Rotations using Cascaded Attention

DEKEL, S.; KELLER, Y.; ČADÍK, M. Estimating Extreme 3D Image Rotations using Cascaded Attention. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle: IEEE Computer Society, 2024. p. 2588-2598. ISBN: 979-8-3503-5301-3.
Název česky
Odhad extrémních 3D rotací kamery mezi snímky pomocí cascaded attention
Typ
článek ve sborníku konference
Jazyk
anglicky
Autoři
Dekel Shay
Keller Yosi, prof., M.Sc., Ph.D.
Čadík Martin, doc. Ing., Ph.D. (UPGM)
URL
Klíčová slova

odhad orientace kamery, extrémní rotace, 3D rotace, cascaded attention

Abstrakt

Odhad velkých až extrémních rotací mezi snímky je kritický pro řadu oblastí
počítačového vidění. Složitá je zejména úloha, kdy mají snímky omezené nebo
dokonce nepřekrývající se zorná pole. V této práci navrhujeme přístup založený na
pozornosti (attention) s řadou nových algoritmických komponent. Protože se odhad
rotace týká obrazových párů, zavádíme nové schéma destilace informace z obrazů
pomocí dekodérů ke zlepšení kvality kódované informace, tzv. embeddingu. Zatímco
současné metody počítají 4D korelační objem (4DCV) kódující vztahy mezi snímky,
navrhujeme využití křížové pozornosti (cross-attention) mezi aktivačními mapami,
který vede na kvalitnější ekvivalent 4DCV. V článku dále představujeme kaskádovou
techniku založenou na dekodéru pro iterativní zpřesňování křížové pozornosti
a odhadu rotace. Náš přístup předčí současné nejmodernější metody odhadu extrémní
rotace. Kód metody zpřístupňujeme veřejnosti.

Rok
2024
Strany
2588–2598
Sborník
Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)
Konference
The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2024, Seattle Convention Center, US
ISBN
979-8-3503-5301-3
Vydavatel
IEEE Computer Society
Místo
Seattle
DOI
UT WoS
001322555902090
EID Scopus
BibTeX
@inproceedings{BUT188275,
  author="Shay {Dekel} and Yosi {Keller} and Martin {Čadík}",
  title="Estimating Extreme 3D Image Rotations using Cascaded Attention",
  booktitle="Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)",
  year="2024",
  pages="2588--2598",
  publisher="IEEE Computer Society",
  address="Seattle",
  doi="10.1109/CVPR52733.2024.00250",
  isbn="979-8-3503-5301-3",
  url="https://cadik.posvete.cz/"
}
Nahoru