arXiv reaDer
カテゴリレベルの3Dオブジェクト知覚のための最適なポーズと形状の推定
Optimal Pose and Shape Estimation for Category-level 3D Object Perception
カテゴリレベルの知覚問題を検討します。この問題では、特定のカテゴリのオブジェクト(たとえば、車)を表す3Dセンサーデータが与えられ、クラス内の変動(つまり、異なる車のモデル)にもかかわらず、オブジェクトのポーズと形状を再構築する必要があります。さまざまな形をしています)。アクティブな形状モデルを検討します。ここで、オブジェクトカテゴリの場合、そのカテゴリのオブジェクトを説明する潜在的なCADモデルのライブラリが与えられ、ポーズと形状の推定が非凸最適化として定式化される標準的な定式化を採用します。 。私たちの最初の貢献は、ポーズと形状の推定のための最初の確実に最適なソルバーを提供することです。特に、回転の推定は、オブジェクトの平行移動と形状の推定から切り離すことができることを示し、(i)最適なオブジェクトの回転は、タイトな(小さいサイズの)半確定緩和によって計算できることを示します。平行移動と形状のパラメータは、回転を指定して閉じた形式で計算できます。 2番目の貢献は、ソルバーに外れ値の棄却層を追加することです。これにより、多数の誤検出に対してロバストになります。この目標に向けて、段階的な非凸性に基づくロバスト推定スキームで最適なソルバーをラップします。外れ値に対するロバスト性をさらに強化するために、凸包と最大クリーク計算を介して外れ値を除去する、カテゴリレベルの知覚で外れ値を除去する最初のグラフ理論定式化も開発します。結果として得られるアプローチは、70%〜90%の外れ値に対してロバストです。私たちの3番目の貢献は、広範な実験的評価です。シミュレートされたデータセットとPASCAL3D +データセットでアブレーション研究を提供することに加えて、ソルバーを深く学習されたキーポイント検出器と組み合わせ、結果として得られるアプローチがApolloScapeデータセットの車両姿勢推定の最先端よりも優れていることを示します。
We consider a category-level perception problem, where one is given 3D sensor data picturing an object of a given category (e.g. a car), and has to reconstruct the pose and shape of the object despite intra-class variability (i.e. different car models have different shapes). We consider an active shape model, where -- for an object category -- we are given a library of potential CAD models describing objects in that category, and we adopt a standard formulation where pose and shape estimation are formulated as a non-convex optimization. Our first contribution is to provide the first certifiably optimal solver for pose and shape estimation. In particular, we show that rotation estimation can be decoupled from the estimation of the object translation and shape, and we demonstrate that (i) the optimal object rotation can be computed via a tight (small-size) semidefinite relaxation, and (ii) the translation and shape parameters can be computed in closed-form given the rotation. Our second contribution is to add an outlier rejection layer to our solver, hence making it robust to a large number of misdetections. Towards this goal, we wrap our optimal solver in a robust estimation scheme based on graduated non-convexity. To further enhance robustness to outliers, we also develop the first graph-theoretic formulation to prune outliers in category-level perception, which removes outliers via convex hull and maximum clique computations; the resulting approach is robust to 70%-90% outliers. Our third contribution is an extensive experimental evaluation. Besides providing an ablation study on a simulated dataset and on the PASCAL3D+ dataset, we combine our solver with a deep-learned keypoint detector, and show that the resulting approach improves over the state of the art in vehicle pose estimation in the ApolloScape datasets.
updated: Fri Apr 16 2021 21:41:29 GMT+0000 (UTC)
published: Fri Apr 16 2021 21:41:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト