arXiv reaDer
逆グラフィックスにおけるロバストな Sim-to-Real 転送のための 3D ニューラル埋め込みの可能性
3D Neural Embedding Likelihood for Robust Sim-to-Real Transfer in Inverse Graphics
インバース グラフィックスによる 3D シーンの認識における中心的な課題は、3D グラフィックスと現実世界のデータとの間のギャップを確実にモデル化することです。このギャップに対処するために、RGB-D 画像に対する新しい 3D Neural Embedding Likelihood (3DNEL) を提案します。 3DNEL は、ニューラル埋め込みを使用して RGB から 2D と 3D の対応を予測し、これを原則的な方法で深度と組み合わせます。 3DNEL は完全に合成画像からトレーニングされ、実世界のデータに一般化されます。この機能を紹介するために、実際の RGB-D 画像からの 6D オブジェクトの姿勢推定に 3DNEL を使用するマルチステージ インバース グラフィックス パイプラインを開発しました。私たちの方法は、YCB-Video データセットでの sim-to-real ポーズ推定において以前の最先端技術よりも優れており、ロバスト性が向上し、大きなエラー予測が大幅に少なくなります。姿勢推定に特化した既存のボトムアップの弁別的アプローチとは異なり、3DNEL は複数オブジェクトのシーンを共同でモデル化する確率的生成定式化を採用しています。この生成的な定式化により、タスク固有の再トレーニングなしで同じ確率モデルで原則に基づく推論を使用して、ビデオからのオブジェクトやカメラの追跡などの追加タスクに 3DNEL を簡単に拡張できます。
A central challenge in 3D scene perception via inverse graphics is robustly modeling the gap between 3D graphics and real-world data. We propose a novel 3D Neural Embedding Likelihood (3DNEL) over RGB-D images to address this gap. 3DNEL uses neural embeddings to predict 2D-3D correspondences from RGB and combines this with depth in a principled manner. 3DNEL is trained entirely from synthetic images and generalizes to real-world data. To showcase this capability, we develop a multi-stage inverse graphics pipeline that uses 3DNEL for 6D object pose estimation from real RGB-D images. Our method outperforms the previous state-of-the-art in sim-to-real pose estimation on the YCB-Video dataset, and improves robustness, with significantly fewer large-error predictions. Unlike existing bottom-up, discriminative approaches that are specialized for pose estimation, 3DNEL adopts a probabilistic generative formulation that jointly models multi-object scenes. This generative formulation enables easy extension of 3DNEL to additional tasks like object and camera tracking from video, using principled inference in the same probabilistic model without task specific retraining.
updated: Tue Feb 07 2023 20:48:35 GMT+0000 (UTC)
published: Tue Feb 07 2023 20:48:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト