arXiv reaDer
BEVDepth: 多視点 3D オブジェクト検出のための信頼できる深度の取得
BEVDepth: Acquisition of Reliable Depth for Multi-view 3D Object Detection
この研究では、カメラベースの鳥瞰図 (BEV) 3D オブジェクト検出のために、BEVDepth と呼ばれる信頼できる深度推定を備えた新しい 3D オブジェクト検出器を提案します。私たちの研究は重要な観察に基づいています。カメラの 3D 検出には深度が不可欠であるという事実を考えると、最近のアプローチでの深度推定は驚くほど不十分です。当社の BEVDepth は、明示的な深度監視を活用することでこれを解決します。深度予測機能を容易にするために、カメラ認識深度推定モジュールも導入されています。さらに、不正確な機能の非投影によってもたらされる副作用に対抗するために、新しい深度調整モジュールを設計します。カスタマイズされた Efficient Voxel Pooling とマルチフレーム メカニズムにより、BEVDepth は、高い効率を維持しながら、挑戦的な nuScenes テスト セットで新しい最先端の 60.9% NDS を達成します。初めて、カメラ モデルの NDS スコアが 60% に達しました。
In this research, we propose a new 3D object detector with a trustworthy depth estimation, dubbed BEVDepth, for camera-based Bird's-Eye-View (BEV) 3D object detection. Our work is based on a key observation -- depth estimation in recent approaches is surprisingly inadequate given the fact that depth is essential to camera 3D detection. Our BEVDepth resolves this by leveraging explicit depth supervision. A camera-awareness depth estimation module is also introduced to facilitate the depth predicting capability. Besides, we design a novel Depth Refinement Module to counter the side effects carried by imprecise feature unprojection. Aided by customized Efficient Voxel Pooling and multi-frame mechanism, BEVDepth achieves the new state-of-the-art 60.9% NDS on the challenging nuScenes test set while maintaining high efficiency. For the first time, the NDS score of a camera model reaches 60%.
updated: Wed Nov 30 2022 11:28:11 GMT+0000 (UTC)
published: Tue Jun 21 2022 03:21:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト