arXiv reaDer
グリッドベースの 3D オブジェクト検出における次元削減の再考
Rethinking Dimensionality Reduction in Grid-based 3D Object Detection
鳥瞰図 (BEV) は、十分に調査された 2D 検出技術の適用性により、現在の点群検出器のほとんどで広く採用されています。ただし、既存の方法では、高さ次元に沿ってボクセルまたはポイント フィーチャを単純に折りたたむことで BEV フィーチャを取得するため、3D 空間情報の大幅な損失が発生します。情報の損失を軽減するために、MDRNet と呼ばれるマルチレベルの特徴次元削減戦略に基づく新しい点群検出ネットワークを提案します。 MDRNet では、空間認識次元削減 (SDR) は、ボクセルから BEV 機能への変換中にオブジェクトの重要な部分に動的に焦点を当てるように設計されています。さらに、マルチレベル空間残差 (MSR) を提案して、BEV フィーチャ マップ内のマルチレベル空間情報を融合します。 nuScenes に関する広範な実験では、提案された方法が最先端の方法よりも優れていることが示されています。コードは公開時に利用可能になります。
Bird's eye view (BEV) is widely adopted by most of the current point cloud detectors due to the applicability of well-explored 2D detection techniques. However, existing methods obtain BEV features by simply collapsing voxel or point features along the height dimension, which causes the heavy loss of 3D spatial information. To alleviate the information loss, we propose a novel point cloud detection network based on a Multi-level feature dimensionality reduction strategy, called MDRNet. In MDRNet, the Spatial-aware Dimensionality Reduction (SDR) is designed to dynamically focus on the valuable parts of the object during voxel-to-BEV feature transformation. Furthermore, the Multi-level Spatial Residuals (MSR) is proposed to fuse the multi-level spatial information in the BEV feature maps. Extensive experiments on nuScenes show that the proposed method outperforms the state-of-the-art methods. The code will be available upon publication.
updated: Sat Dec 17 2022 07:53:07 GMT+0000 (UTC)
published: Tue Sep 20 2022 04:51:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト