arXiv reaDer
中間レベルの視覚的表現を使用したオブジェクトポーズ推定
Object Pose Estimation using Mid-level Visual Representations
この作品は、以前は見られなかった環境に効果的に転送できるオブジェクトカテゴリの新しいポーズ推定モデルを提案します。ポーズ推定用のディープ畳み込みネットワークモデル(CNN)は、通常、オブジェクト検出、ポーズ推定、または大量のトレーニングデータを必要とする3D再構成用に特別にキュレートされたデータセットでトレーニングおよび評価されます。この作業では、少量のデータでトレーニングでき、一般的な中間レベルの表現taskonomy2018(たとえば、表面法線推定と再シェーディング)の上に構築されたポーズ推定のモデルを提案します。これらの表現は、ポーズやオブジェクトの注釈を必要とせずに、大規模なデータセットでトレーニングされます。後で、予測は、オブジェクトマスクとシルエット検索を活用する小さなCNNニューラルネットワークで洗練されます。提示されたアプローチは、Pix3Dデータセットpix3dで優れたパフォーマンスを実現し、トレーニングデータの25%しか利用できない場合、既存のモデルよりも35%近く向上します。一般化と新しい環境への移行に関しては、このアプローチが好ましいことを示しています。この目的に向けて、挑戦的なアクティブビジョンデータセットAmmirato2017ADFで一般的に遭遇する家具カテゴリの新しいポーズ推定ベンチマークを導入し、Pix3Dデータセットでトレーニングされたモデルを評価しました。
This work proposes a novel pose estimation model for object categories that can be effectively transferred to previously unseen environments. The deep convolutional network models (CNN) for pose estimation are typically trained and evaluated on datasets specifically curated for object detection, pose estimation, or 3D reconstruction, which requires large amounts of training data. In this work, we propose a model for pose estimation that can be trained with small amount of data and is built on the top of generic mid-level representations taskonomy2018 (e.g. surface normal estimation and re-shading). These representations are trained on a large dataset without requiring pose and object annotations. Later on, the predictions are refined with a small CNN neural network that exploits object masks and silhouette retrieval. The presented approach achieves superior performance on the Pix3D dataset pix3d and shows nearly 35% improvement over the existing models when only 25% of the training data is available. We show that the approach is favorable when it comes to generalization and transfer to novel environments. Towards this end, we introduce a new pose estimation benchmark for commonly encountered furniture categories on challenging Active Vision Dataset Ammirato2017ADF and evaluated the models trained on the Pix3D dataset.
updated: Wed Mar 02 2022 22:49:17 GMT+0000 (UTC)
published: Wed Mar 02 2022 22:49:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト