arXiv reaDer
EA-LSS: 3D BEV 物体検出のためのエッジ認識リフト スプラット ショット フレームワーク
EA-LSS: Edge-aware Lift-splat-shot Framework for 3D BEV Object Detection
近年、Lift-Splat-Shot ベース (LSS ベース) の 3D オブジェクト検出方法が大きく進歩しました。ただし、不正確な深度推定は、特に深度が大幅に変化する領域 (つまり、「深度ジャンプ」問題) において、カメラのみおよびマルチモデル 3D オブジェクト検出モデルの精度に対する重要な制約のままです。この論文では、新しい Edge-aware Lift-splat-shot (EA-LSS) フレームワークを提案しました。具体的には、「深度ジャンプ」問題を軽減するためにエッジ認識深度融合 (EADF) モジュールが提案され、深度に対する精緻な監視をさらに強化するために細粒深度 (FGD) モジュールが提案されています。当社の EA-LSS フレームワークは、LSS ベースの 3D 物体検出モデルと互換性があり、推論時間の無視できる増加でパフォーマンスを効果的に向上させます。 nuScenes ベンチマークの実験では、EA-LSS がカメラのみのモデルでもマルチモデル モデルでも有効であることが実証されています。 EA-LSS が nuScenes テスト ベンチマークで、mAP が 76.5%、NDS が 77.6% という最先端のパフォーマンスを達成したことは注目に値します。
In recent years, great progress has been made in the Lift-Splat-Shot-based (LSS-based) 3D object detection method. However, inaccurate depth estimation remains an important constraint to the accuracy of camera-only and multi-model 3D object detection models, especially in regions where the depth changes significantly (i.e., the ``depth jump'' problem). In this paper, we proposed a novel Edge-aware Lift-splat-shot (EA-LSS) framework. Specifically, edge-aware depth fusion (EADF) module is proposed to alleviate the ``depth jump'' problem and fine-grained depth (FGD) module to further enforce refined supervision on depth. Our EA-LSS framework is compatible for any LSS-based 3D object detection models, and effectively boosts their performances with negligible increment of inference time. Experiments on nuScenes benchmarks demonstrate that EA-LSS is effective in either camera-only or multi-model models. It is worth mentioning that EA-LSS achieved the state-of-the-art performance on nuScenes test benchmarks with mAP and NDS of 76.5% and 77.6%, respectively.
updated: Tue Aug 22 2023 11:56:19 GMT+0000 (UTC)
published: Fri Mar 31 2023 08:56:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト