arXiv reaDer
カスケード関係と反復再構成ネットワークによるカテゴリレベルの6Dオブジェクトポーズ推定
Category-Level 6D Object Pose Estimation via Cascaded Relation and Recurrent Reconstruction Networks
見えないオブジェクトインスタンスの位置と方向を予測することを目的としたカテゴリレベルの6Dポーズ推定は、ロボット操作や拡張現実などの多くのシナリオの基本ですが、まだ解決されていません。正準空間でインスタンス3Dモデルを正確に復元し、それを観測と正確に一致させることは、見えないオブジェクトの6Dポーズを推定する際の重要なポイントです。この論文では、カスケード関係と反復再構成ネットワークを介して正確なカテゴリレベルの6Dポーズ推定を実現します。具体的には、新しいカスケード関係ネットワークは、インスタンスRGB画像、インスタンスポイントクラウド、およびカテゴリ形状の間の複雑で有益な関係を事前に調査するための高度な表現学習専用です。さらに、再構成と対応の推定を粗いものから細かいものへと段階的に改善するために、反復残差改良のための反復再構成ネットワークを設計します。最後に、インスタンスの点群と標準空間で再構築された3Dモデルとの間の推定された密な対応を利用して、インスタンスの6Dポーズが取得されます。カテゴリレベルの6Dポーズ推定の2つのよく知られたベンチマークで広範な実験を実施し、既存のアプローチよりもパフォーマンスが大幅に向上しました。 3D_75および5 ^∘2cmの代表的に厳密な評価指標では、私たちの方法は、最新のSPDをCAMERA25データセットで4.9%および17.7%、REAL275データセットで2.7%および8.5%上回っています。 。コードはhttps://wangjiaze.cn/projects/6DPoseEstimation.htmlで入手できます。
Category-level 6D pose estimation, aiming to predict the location and orientation of unseen object instances, is fundamental to many scenarios such as robotic manipulation and augmented reality, yet still remains unsolved. Precisely recovering instance 3D model in the canonical space and accurately matching it with the observation is an essential point when estimating 6D pose for unseen objects. In this paper, we achieve accurate category-level 6D pose estimation via cascaded relation and recurrent reconstruction networks. Specifically, a novel cascaded relation network is dedicated for advanced representation learning to explore the complex and informative relations among instance RGB image, instance point cloud and category shape prior. Furthermore, we design a recurrent reconstruction network for iterative residual refinement to progressively improve the reconstruction and correspondence estimations from coarse to fine. Finally, the instance 6D pose is obtained leveraging the estimated dense correspondences between the instance point cloud and the reconstructed 3D model in the canonical space. We have conducted extensive experiments on two well-acknowledged benchmarks of category-level 6D pose estimation, with significant performance improvement over existing approaches. On the representatively strict evaluation metrics of 3D_75 and 5^∘2 cm, our method exceeds the latest state-of-the-art SPD by 4.9% and 17.7% on the CAMERA25 dataset, and by 2.7% and 8.5% on the REAL275 dataset. Codes are available at https://wangjiaze.cn/projects/6DPoseEstimation.html.
updated: Thu Aug 19 2021 15:46:52 GMT+0000 (UTC)
published: Thu Aug 19 2021 15:46:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト