arXiv reaDer
Object as Query: 任意の 2D オブジェクト検出器に 3D 検出機能を装備
Object as Query: Equipping Any 2D Object Detector with 3D Detection Ability
多視点画像からの 3D オブジェクト検出は、過去数年間で大きな注目を集めています。既存の方法は、主に多視点画像から 3D 表現を確立し、オブジェクト検出に高密度の検出ヘッドを採用するか、3D 空間に分散されたオブジェクト クエリを使用してオブジェクトをローカライズします。この論文では、マルチビュー 3D オブジェクト検出を促進するために任意の 2D オブジェクト検出器を装備できるマルチビュー 2D オブジェクト誘導型 3D オブジェクト検出器 (MV2D) を設計します。 2D 検出はオブジェクトの存在に関する貴重な事前情報を提供できるため、MV2D は 2D 検出器を利用して、豊富な画像セマンティクスを条件とするオブジェクト クエリを生成します。これらの動的に生成されたクエリにより、MV2D は計算コストを増加させることなく、より大きな 3D 空間でオブジェクトを検出でき、3D オブジェクトをローカライズする強力な機能を示します。生成されたクエリに対して、スパース クロス アテンション モジュールを設計して、特定のオブジェクトの機能に集中するように強制します。これにより、計算コストが削減され、ノイズによる干渉が抑制されます。 nuScenes データセットの評価結果は、動的オブジェクト クエリとスパース フィーチャ アグリゲーションが 3D 検出機能に悪影響を与えないことを示しています。 MV2Dも既存手法の中でも最先端の性能を発揮します。 MV2D が将来の研究の新しいベースラインとして役立つことを願っています。
3D object detection from multi-view images has drawn much attention over the past few years. Existing methods mainly establish 3D representations from multi-view images and adopt a dense detection head for object detection, or employ object queries distributed in 3D space to localize objects. In this paper, we design Multi-View 2D Objects guided 3D Object Detector (MV2D), which can be equipped with any 2D object detector to promote multi-view 3D object detection. Since 2D detections can provide valuable priors for object existence, MV2D exploits 2D detector to generate object queries conditioned on the rich image semantics. These dynamically generated queries enable MV2D to detect objects in larger 3D space without increased computational costs and shows a strong capability of localizing 3D objects. For the generated queries, we design a sparse cross attention module to force them to focus on the features of specific objects, which reduces the computational cost and suppresses interference from noises. The evaluation results on the nuScenes dataset demonstrate that dynamic object queries and sparse feature aggregation do not harm 3D detection capability. MV2D also exhibits a state-of-the-art performance among existing methods. We hope MV2D can serve as a new baseline for future research.
updated: Fri Jan 06 2023 04:08:20 GMT+0000 (UTC)
published: Fri Jan 06 2023 04:08:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト