オブジェクトの姿勢推定は、いくつかのユース ケースを挙げると、ロボットによる操作、ビンのピッキング、拡張現実、およびシーンの理解を可能にする重要なタスクです。単眼物体の姿勢推定は、高性能な深層学習ベースのソリューションの台頭によりかなりの勢いを増しており、センサーは安価で推論が高速であるため、コミュニティにとって特に興味深いものです。以前の研究では、さまざまなポーズ推定問題に対する包括的な最先端技術が確立されています。それらの範囲が広いため、有望な将来の方向性を特定することは困難です。ロボット工学で一般的に使用されている単発単眼 6D オブジェクトの姿勢推定の問題に範囲を絞り込み、そのような傾向を特定することができます。ロボット工学とコンピューター ビジョンの最近の出版物を検討することで、最先端の技術が両方の分野の融合で確立されます。それに続いて、有望な研究の方向性を特定し、研究者が関連する研究アイデアを策定し、最先端の技術を効果的に前進させるのを支援します。調査結果には、メソッドがドメイン シフトを克服するのに十分に洗練されていること、およびオクルージョン処理が基本的な課題であることが含まれています。また、ロボット工学を進歩させるための中心的な課題として、新しいオブジェクトの姿勢推定や困難なマテリアルハンドリングなどの問題を強調しています。
Object pose estimation is a non-trivial task that enables robotic manipulation, bin picking, augmented reality, and scene understanding, to name a few use cases. Monocular object pose estimation gained considerable momentum with the rise of high-performing deep learning-based solutions and is particularly interesting for the community since sensors are inexpensive and inference is fast. Prior works establish the comprehensive state of the art for diverse pose estimation problems. Their broad scopes make it difficult to identify promising future directions. We narrow down the scope to the problem of single-shot monocular 6D object pose estimation, which is commonly used in robotics, and thus are able to identify such trends. By reviewing recent publications in robotics and computer vision, the state of the art is established at the union of both fields. Following that, we identify promising research directions in order to help researchers to formulate relevant research ideas and effectively advance the state of the art. Findings include that methods are sophisticated enough to overcome the domain shift and that occlusion handling is a fundamental challenge. We also highlight problems such as novel object pose estimation and challenging materials handling as central challenges to advance robotics.