arXiv reaDer
3D オブジェクト検出のための Sparse Dense Fusion
Sparse Dense Fusion for 3D Object Detection
マルチモーダル学習の普及により、カメラと LiDAR の融合が 3D オブジェクト検出で人気を博しています。複数の融合アプローチが提案されていますが、融合モジュールの特徴表現に基づいて、疎のみまたは密のみの方法に分類できます。このホワイトペーパーでは、それらを共通の分類法で分析し、その後、2 つの課題を観察します。1) 疎のみのソリューションは、3D 幾何学的事前を保持しますが、カメラからの豊富なセマンティック情報を失います。2) 密のみの代替は、セマンティックな連続性を保持しますが、見落とします。 LiDAR からの正確な幾何学的情報。これら 2 つの定式化を分析することにより、それらの設計スキームのために情報の損失は避けられないと結論付けます。いずれかの方法での情報の損失を補うために、Transformer アーキテクチャを介して疎融合モジュールと密融合モジュールの両方を組み込む補完的なフレームワークである疎密融合 (SDF) を提案します。このような単純でありながら効果的な疎密融合構造は、セマンティック テクスチャを豊かにし、空間構造情報を同時に活用します。 SDF 戦略を通じて、中程度のパフォーマンスを持つ 2 つの一般的な方法を組み合わせ、mAP で 4.3%、NDS で 2.5% ベースラインを上回り、nuScenes ベンチマークで 1 位にランクされました。広範なアブレーションは、私たちの方法の有効性を実証し、経験的に分析を調整します。
With the prevalence of multimodal learning, camera-LiDAR fusion has gained popularity in 3D object detection. Although multiple fusion approaches have been proposed, they can be classified into either sparse-only or dense-only fashion based on the feature representation in the fusion module. In this paper, we analyze them in a common taxonomy and thereafter observe two challenges: 1) sparse-only solutions preserve 3D geometric prior and yet lose rich semantic information from the camera, and 2) dense-only alternatives retain the semantic continuity but miss the accurate geometric information from LiDAR. By analyzing these two formulations, we conclude that the information loss is inevitable due to their design scheme. To compensate for the information loss in either manner, we propose Sparse Dense Fusion (SDF), a complementary framework that incorporates both sparse-fusion and dense-fusion modules via the Transformer architecture. Such a simple yet effective sparse-dense fusion structure enriches semantic texture and exploits spatial structure information simultaneously. Through our SDF strategy, we assemble two popular methods with moderate performance and outperform baseline by 4.3% in mAP and 2.5% in NDS, ranking first on the nuScenes benchmark. Extensive ablations demonstrate the effectiveness of our method and empirically align our analysis.
updated: Sun Apr 09 2023 07:10:34 GMT+0000 (UTC)
published: Sun Apr 09 2023 07:10:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト