arXiv reaDer
VI-Net: 球面表現上の分離された回転の学習によるカテゴリレベルの 6D オブジェクトの姿勢推定の向上
VI-Net: Boosting Category-level 6D Object Pose Estimation via Learning Decoupled Rotations on the Spherical Representations
RGB-D 物体観察からの高精度の回転推定は、SO(3) の非線形空間での学習の難しさのため、6D 物体姿勢推定では大きな課題です。この論文では、視点回転と面内回転の組み合わせとして回転を分離することでタスクを容易にする、VI-Net と呼ばれる新しい回転推定ネットワークを提案します。より具体的には、VI-Net は、2 つの因数分解された回転の推定のための 2 つの個別のブランチを持つ球面での特徴学習をベースにしています。V ブランチは、球面信号の二値分類を介して視点回転を学習するために使用され、別の I-ブランチは使用されます。天頂方向から見えるように信号を変換することにより、面内回転を推定するために使用されます。球面信号を処理するために、SPAtial Spherical Convolution (SPA-SConv) の新しい設計に基づいて球面特徴ピラミッド ネットワークが構築されます。これは、特徴パディングを介して球面信号の境界問題を解決し、対称畳み込み演算によって視点の等変特徴抽出を実現します。提案した VI-Net を、利用可能な CAD モデルなしで未知の物体の姿勢を予測するためのカテゴリレベルの 6D 物体の姿勢推定という困難なタスクに適用します。ベンチマークデータセットの実験により、私たちの方法の有効性が確認され、高精度の領域で大きなマージンで既存の方法を上回ります。
Rotation estimation of high precision from an RGB-D object observation is a huge challenge in 6D object pose estimation, due to the difficulty of learning in the non-linear space of SO(3). In this paper, we propose a novel rotation estimation network, termed as VI-Net, to make the task easier by decoupling the rotation as the combination of a viewpoint rotation and an in-plane rotation. More specifically, VI-Net bases the feature learning on the sphere with two individual branches for the estimates of two factorized rotations, where a V-Branch is employed to learn the viewpoint rotation via binary classification on the spherical signals, while another I-Branch is used to estimate the in-plane rotation by transforming the signals to view from the zenith direction. To process the spherical signals, a Spherical Feature Pyramid Network is constructed based on a novel design of SPAtial Spherical Convolution (SPA-SConv), which settles the boundary problem of spherical signals via feature padding and realizesviewpoint-equivariant feature extraction by symmetric convolutional operations. We apply the proposed VI-Net to the challenging task of category-level 6D object pose estimation for predicting the poses of unknown objects without available CAD models; experiments on the benchmarking datasets confirm the efficacy of our method, which outperforms the existing ones with a large margin in the regime of high precision.
updated: Sat Aug 19 2023 05:47:53 GMT+0000 (UTC)
published: Sat Aug 19 2023 05:47:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト