arXiv reaDer
遠近法における剛性保存画像変換と同変
Rigidity Preserving Image Transformations and Equivariance in Perspective
剛性のあるカメラの動きを実現する画像平面変換のクラスを特徴づけ、これらの変換を「剛性の維持」と呼びます。特に、ピンホール画像の2D変換は、剛性を維持しません。したがって、3D推論タスクにCNNを使用する場合、変換への同変から剛性を維持する変換への同変への誘導バイアスを変更することが有益な場合があります。剛性を維持する変換に関する同変写像をCNNでどのように近似できるかを調査し、6Dオブジェクトのポーズ推定と視覚的位置特定の両方でアイデアをテストします。実験的に、いくつかの競争力のあるベースラインを改善します。
We characterize the class of image plane transformations which realize rigid camera motions and call these transformations `rigidity preserving'. In particular, 2D translations of pinhole images are not rigidity preserving. Hence, when using CNNs for 3D inference tasks, it can be beneficial to modify the inductive bias from equivariance towards translations to equivariance towards rigidity preserving transformations. We investigate how equivariance with respect to rigidity preserving transformations can be approximated in CNNs, and test our ideas on both 6D object pose estimation and visual localization. Experimentally, we improve on several competitive baselines.
updated: Thu Oct 13 2022 09:14:42 GMT+0000 (UTC)
published: Mon Jan 31 2022 08:43:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト