arXiv reaDer
ZebraPose:6DoFオブジェクトポーズ推定のための粗い表面から細かい表面へのエンコーディング
ZebraPose: Coarse to Fine Surface Encoding for 6DoF Object Pose Estimation
画像から3Dへの対応を確立することは、長い間6DoFオブジェクトポーズ推定の重要なタスクでした。ポーズをより正確に予測するために、深く学習された密なマップが疎なテンプレートに取って代わりました。密な方法はまた、咬合の存在下でのポーズ推定を改善しました。最近では、研究者はオブジェクトの断片をセグメンテーションとして学習することで改善を示しています。この作業では、オブジェクトの表面を密に表すことができる個別の記述子を提示します。階層的なバイナリグループを組み込むことにより、オブジェクトサーフェスを非常に効率的にエンコードできます。さらに、きめ細かい対応予測を可能にする粗いトレーニング戦略から細かいトレーニング戦略を提案します。最後に、予測されたコードをオブジェクトサーフェスと照合し、PnPソルバーを使用して、6DoFポーズを推定します。公開されているLM-OおよびYCB-Vデータセットの結果は、最新のADD(-S)メトリックよりも大幅に改善されており、場合によってはRGB-Dベースの方法を上回っています。
Establishing correspondences from image to 3D has been a key task of 6DoF object pose estimation for a long time. To predict pose more accurately, deeply learned dense maps replaced sparse templates. Dense methods also improved pose estimation in the presence of occlusion. More recently researchers have shown improvements by learning object fragments as segmentation. In this work, we present a discrete descriptor, which can represent the object surface densely. By incorporating a hierarchical binary grouping, we can encode the object surface very efficiently. Moreover, we propose a coarse to fine training strategy, which enables fine-grained correspondence prediction. Finally, by matching predicted codes with object surface and using a PnP solver, we estimate the 6DoF pose. Results on the public LM-O and YCB-V datasets show major improvement over the state of the art w.r.t. ADD(-S) metric, even surpassing RGB-D based methods in some cases.
updated: Thu Mar 17 2022 16:16:24 GMT+0000 (UTC)
published: Thu Mar 17 2022 16:16:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト