arXiv reaDer
Gaussian Implicit Occupancy Function を使用した 3D 認識オブジェクト ローカリゼーション
3D-Aware Object Localization using Gaussian Implicit Occupancy Function
画像内のターゲット オブジェクトを自動的にローカライズすることは、多くのコンピューター ビジョン アプリケーションにとって重要です。最近、楕円表現は、オブジェクトのローカライゼーションのための軸に沿った境界ボックスの代替として識別されました。この論文では、3D 対応の楕円ラベル、つまり、2D ターゲット ローカリゼーション用の画像内のオブジェクトの 3D 楕円体近似の投影を考慮しています。このような一般的な楕円体モデルは、大まかに既知のターゲットを処理することを可能にし、3D 認識楕円検出は、従来の 3D に依存しない境界ボックス ラベルよりもオブジェクトに関するより多くの幾何学的情報を運びます。楕円回帰を新たに見て、幾何学的楕円パラメータを画像内のオブジェクト占有率をエンコードする暗黙のガウス分布のパラメータに置き換えることを提案します。モデルは、連続統計損失関数を使用して、画像ピクセル全体でこの二変量ガウス分布の値を回帰するようにトレーニングされます。分布パラメーターを抽出するために、新しいトレーニング不可能な微分可能層、E-DSNT を導入します。また、ターゲットの粗い次元と相対ポーズ ラベルのみを使用して、一貫した 3D 対応のガウス占有パラメーターを簡単に生成する方法についても説明します。仮説を検証するために、3D 対応のガウス占有ラベルを使用して 3 つの既存の宇宙船姿勢推定データセットを拡張します。
To automatically localize a target object in an image is crucial for many computer vision applications. Recently ellipse representations have been identified as an alternative to axis-aligned bounding boxes for object localization. This paper considers 3D-aware ellipse labels, i.e., which are projections of a 3D ellipsoidal approximation of the object in the images for 2D target localization. Such generic ellipsoidal models allow for handling coarsely known targets, and 3D-aware ellipse detections carry more geometric information about the object than traditional 3D-agnostic bounding box labels. We propose to have a new look at ellipse regression and replace the geometric ellipse parameters with the parameters of an implicit Gaussian distribution encoding object occupancy in the image. The models are trained to regress the values of this bivariate Gaussian distribution over the image pixels using a continuous statistical loss function. We introduce a novel non-trainable differentiable layer, E-DSNT, to extract the distribution parameters. Also, we describe how to readily generate consistent 3D-aware Gaussian occupancy parameters using only coarse dimensions of the target and relative pose labels. We extend three existing spacecraft pose estimation datasets with 3D-aware Gaussian occupancy labels to validate our hypothesis.
updated: Fri Mar 03 2023 16:28:22 GMT+0000 (UTC)
published: Fri Mar 03 2023 16:28:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト