arXiv reaDer
ステレオ 3D オブジェクト検出と陰的サーフェス再構成のジョイント
Joint stereo 3D object detection and implicit surface reconstruction
SO(3) で正確なオブジェクトの向きを回復し、ステレオ RGB 画像から屋外の剛体オブジェクトの暗黙の形状を同時に予測できる新しい学習ベースのフレームワーク S-3D-RCNN を提示します。局所的な外観を観察角度にマッピングする以前の研究とは対照的に、意味のある中間幾何学的表現 (IGR) を抽出して自己中心的なオブジェクト指向を推定することにより、進歩的なアプローチを探ります。このアプローチは、知覚された強度をオブジェクト パーツの座標に変換するディープ モデルを特徴としています。これは、カメラ座標系でオブジェクトの向きをエンコードする 3D 表現にマッピングされます。暗黙的な形状推定を有効にするために、IGR はさらに拡張されて、点ベースの表現で可視オブジェクトの表面をモデル化し、目に見えない表面の幻覚の問題に明示的に対処します。広範な実験により、提案された IGR の有効性が検証され、S-3D-RCNN は、KITTI ベンチマークで既存および提案された新しいメトリックを使用して、優れた 3D シーン理解パフォーマンスを達成します。コードと事前トレーニング済みのモデルは、この https URL で入手できます。
We present a new learning-based framework S-3D-RCNN that can recover accurate object orientation in SO(3) and simultaneously predict implicit shapes for outdoor rigid objects from stereo RGB images. In contrast to previous studies that map local appearance to observation angles, we explore a progressive approach by extracting meaningful Intermediate Geometrical Representations (IGRs) to estimate egocentric object orientation. This approach features a deep model that transforms perceived intensities to object part coordinates, which are mapped to a 3D representation encoding object orientation in the camera coordinate system. To enable implicit shape estimation, the IGRs are further extended to model visible object surface with a point-based representation and explicitly addresses the unseen surface hallucination problem. Extensive experiments validate the effectiveness of the proposed IGRs and S-3D-RCNN achieves superior 3D scene understanding performance using existing and proposed new metrics on the KITTI benchmark. Code and pre-trained models will be available at this https URL.
updated: Tue Feb 07 2023 05:53:41 GMT+0000 (UTC)
published: Thu Nov 25 2021 05:52:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト