arXiv reaDer
マルチビューからHollow-3Dへ:3Dオブジェクト検出用の幻覚Hollow-3D R-CNN
From Multi-View to Hollow-3D: Hallucinated Hollow-3D R-CNN for 3D Object Detection
正確な距離検知を備えた新しいデータモーダルとして、LiDARポイントクラウドは3Dシーンの理解に大きな期待を寄せています。ただし、点群は常に3D空間にまばらに分布しており、構造化されていないストレージがあるため、効果的な3Dオブジェクト検出のために点群を表現することは困難です。この目的のために、この作業では、点群を中空3Dデータと見なし、3Dオブジェクト検出の問題に対処するための新しいアーキテクチャ、つまり幻覚中空-3D R-CNN(H ^ 23D R-CNN)を提案します。私たちのアプローチでは、最初に、点群を透視図と鳥瞰図に順次投影することにより、マルチビューの特徴を抽出します。次に、新しい両側ガイドマルチビューフュージョンブロックによって3D表現を幻覚化します。最後に、3Dオブジェクトは、新しい階層型ボクセルRoIプーリング操作を備えたボックスリファインメントモジュールを介して検出されます。提案されたH ^ 23D R-CNNは、効率的なフレームワークを備えた透視図と鳥瞰図の補足情報を最大限に活用するための新しい角度を提供します。公開されているKITTIデータセットとWaymoOpenデータセットに対するアプローチを評価します。広範な実験は、有効性と効率の両方に関して、最先端のアルゴリズムに対する私たちの方法の優位性を示しています。コードはhttps://github.com/djiajunustc/H-23D_R-CNNで入手できます。
As an emerging data modal with precise distance sensing, LiDAR point clouds have been placed great expectations on 3D scene understanding. However, point clouds are always sparsely distributed in the 3D space, and with unstructured storage, which makes it difficult to represent them for effective 3D object detection. To this end, in this work, we regard point clouds as hollow-3D data and propose a new architecture, namely Hallucinated Hollow-3D R-CNN (H^23D R-CNN), to address the problem of 3D object detection. In our approach, we first extract the multi-view features by sequentially projecting the point clouds into the perspective view and the bird-eye view. Then, we hallucinate the 3D representation by a novel bilaterally guided multi-view fusion block. Finally, the 3D objects are detected via a box refinement module with a novel Hierarchical Voxel RoI Pooling operation. The proposed H^23D R-CNN provides a new angle to take full advantage of complementary information in the perspective view and the bird-eye view with an efficient framework. We evaluate our approach on the public KITTI Dataset and Waymo Open Dataset. Extensive experiments demonstrate the superiority of our method over the state-of-the-art algorithms with respect to both effectiveness and efficiency. The code will be made available at https://github.com/djiajunustc/H-23D_R-CNN.
updated: Fri Jul 30 2021 02:00:06 GMT+0000 (UTC)
published: Fri Jul 30 2021 02:00:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト