arXiv reaDer
L6DNet:小さなデータセットでロバストで正確なオブジェクトポーズ推定のためのLight 6DoFネットワーク
L6DNet: Light 6 DoF Network for Robust and Precise Object Pose Estimation with Small Datasets
オブジェクトの3Dポーズを推定することは、拡張現実またはロボットアプリケーション内で検討できる困難な作業です。この論文では、単一のRGB-D画像から6自由度のオブジェクトポーズ推定を実行するための新しいアプローチを提案します。ハイブリッドパイプラインは、それぞれデータ駆動型と幾何学的の2段階で採用されています。データ駆動型ステップは、ローカルパッチから画像内のオブジェクトの2D位置を推定する分類CNNと、それに続くカメラ座標系のキーポイントのセットの3D位置を予測するようにトレーニングされた回帰CNNで構成されます。ポーズ情報を抽出するための幾何学的ステップは、登録エラーを最小限に抑えてポーズを計算することにより、カメラ座標系の3Dポイントをワールド座標系の対応する3Dポイントに位置合わせすることです。標準データセットLineModでの実験は、私たちのアプローチが最先端の方法よりも堅牢で正確であることを示しています。このアプローチは、ビジュアルサーボによって6DoFポジショニングタスクを達成するためにも検証されています。
Estimating the 3D pose of an object is a challenging task that can be considered within augmented reality or robotic applications. In this paper, we propose a novel approach to perform 6 DoF object pose estimation from a single RGB-D image. We adopt a hybrid pipeline in two stages: data-driven and geometric respectively. The data-driven step consists of a classification CNN to estimate the object 2D location in the image from local patches, followed by a regression CNN trained to predict the 3D location of a set of keypoints in the camera coordinate system. To extract the pose information, the geometric step consists in aligning the 3D points in the camera coordinate system with the corresponding 3D points in world coordinate system by minimizing a registration error, thus computing the pose. Our experiments on the standard dataset LineMod show that our approach is more robust and accurate than state-of-the-art methods. The approach is also validated to achieve a 6 DoF positioning task by visual servoing.
updated: Thu Jan 07 2021 08:18:10 GMT+0000 (UTC)
published: Mon Feb 03 2020 17:41:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト