arXiv reaDer
Sparse4D: スパース時空間融合によるマルチビュー 3D オブジェクト検出
Sparse4D: Multi-view 3D Object Detection with Sparse Spatial-Temporal Fusion
鳥瞰図 (BEV) ベースの方法は、最近、マルチビュー 3D 検出タスクで大きな進歩を遂げました。 BEV ベースのメソッドと比較すると、スパース ベースのメソッドはパフォーマンスが劣りますが、無視できないメリットがたくさんあります。スパース 3D 検出をさらに推し進めるために、この作業では、Sparse4D という名前の新しい方法を導入します。これは、まばらにサンプリングし、時空間的特徴を融合することにより、アンカー ボックスを反復的に改良します。 (1) スパース 4D サンプリング: 各 3D アンカーに複数の 4D キーポイントを割り当て、それをマルチビュー/スケール/タイムスタンプ画像フィーチャに投影して、対応するフィーチャをサンプリングします。 (2) 階層特徴融合: 異なるビュー/スケール、異なるタイムスタンプ、および異なるキーポイントのサンプリングされた特徴を階層的に融合して、高品質のインスタンス特徴を生成します。このように、Sparse4D は、密なビューの変換やグローバルな注意に頼ることなく、効率的かつ効果的に 3D 検出を実現でき、エッジ デバイスの展開により適しています。さらに、インスタンス レベルの深度リウェイト モジュールを導入して、3D から 2D への投影における不適切な設定の問題を軽減します。実験では、nuScenes データセットの検出タスクで、すべてのスパース ベースのメソッドとほとんどの BEV ベースのメソッドよりも優れたパフォーマンスが得られました。
Bird-eye-view (BEV) based methods have made great progress recently in multi-view 3D detection task. Comparing with BEV based methods, sparse based methods lag behind in performance, but still have lots of non-negligible merits. To push sparse 3D detection further, in this work, we introduce a novel method, named Sparse4D, which does the iterative refinement of anchor boxes via sparsely sampling and fusing spatial-temporal features. (1) Sparse 4D Sampling: for each 3D anchor, we assign multiple 4D keypoints, which are then projected to multi-view/scale/timestamp image features to sample corresponding features; (2) Hierarchy Feature Fusion: we hierarchically fuse sampled features of different view/scale, different timestamp and different keypoints to generate high-quality instance feature. In this way, Sparse4D can efficiently and effectively achieve 3D detection without relying on dense view transformation nor global attention, and is more friendly to edge devices deployment. Furthermore, we introduce an instance-level depth reweight module to alleviate the ill-posed issue in 3D-to-2D projection. In experiment, our method outperforms all sparse based methods and most BEV based methods on detection task in the nuScenes dataset.
updated: Sat Nov 19 2022 04:20:57 GMT+0000 (UTC)
published: Sat Nov 19 2022 04:20:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト