オブジェクトの 3D ジオメトリが正確な 3D モデルとしてではなく、おおよそだけ与えられる単一の画像からオブジェクトの 6D ポーズを推定する新しい手法を提示します。これを実現するために、すべてのピクセルの 3D モデル座標を回帰する高密度の 2D から 3D 対応予測子を採用しています。 3D 座標に加えて、モデルはピクセル単位の座標誤差も推定して、間違っている可能性のある対応を破棄します。これにより、オブジェクトの複数の 6D ポーズ仮説を生成できます。次に、非常に効率的な領域ベースのアプローチを使用して反復的に改良します。また、各仮説の確率を推定し、最も可能性の高いものを選択できる、新しいピクセル単位の事後定式化も導入します。実験で示したように、私たちのアプローチは、露出オーバー、高コントラスト、低信号対雑音比などの極端な視覚条件に対処できます。これは、軌道上ロボット アプリケーションのタンブリング衛星の姿勢を推定するという特に困難なタスクの強力な手法になります。私たちの方法は、SPEED+ データセットで最先端のパフォーマンスを達成し、SPEC2021 事後分析コンテストで優勝しました。
We present a novel technique to estimate the 6D pose of objects from single images where the 3D geometry of the object is only given approximately and not as a precise 3D model. To achieve this, we employ a dense 2D-to-3D correspondence predictor that regresses 3D model coordinates for every pixel. In addition to the 3D coordinates, our model also estimates the pixel-wise coordinate error to discard correspondences that are likely wrong. This allows us to generate multiple 6D pose hypotheses of the object, which we then refine iteratively using a highly efficient region-based approach. We also introduce a novel pixel-wise posterior formulation by which we can estimate the probability for each hypothesis and select the most likely one. As we show in experiments, our approach is capable of dealing with extreme visual conditions including overexposure, high contrast, or low signal-to-noise ratio. This makes it a powerful technique for the particularly challenging task of estimating the pose of tumbling satellites for in-orbit robotic applications. Our method achieves state-of-the-art performance on the SPEED+ dataset and has won the SPEC2021 post-mortem competition.