arXiv reaDer
VPFNet:マルチクラス3Dオブジェクト検出のためのボクセル-ピクセルフュージョンネットワーク
VPFNet: Voxel-Pixel Fusion Network for Multi-class 3D Object Detection
大きなオブジェクトの検出、単一クラスのオブジェクトの検出、または簡単な状況下での多くのLiDARベースの方法は、非常にうまく機能すると主張されていました。ただし、画像のセマンティクスを活用できなかったため、小さなオブジェクトや困難な状況での検出のパフォーマンスは、フュージョンベースのパフォーマンスを上回りませんでした。複雑な環境での検出パフォーマンスを向上させるために、この論文では、Voxel-Pixel Fusion Network(Voxel-Pixel Fusion Network( VPFNet)。このネットワーク内では、ボクセルとピクセルのペアの幾何学的関係を利用し、ボクセルの特徴とピクセルの特徴を適切なメカニズムで融合する、ボクセルとピクセルの融合(VPF)レイヤーと呼ばれる重要な新しいコンポーネントがあります。さらに、いくつかのパラメータは、ボクセルとピクセルのペアの特性を考慮した後、融合効果を導き、強化するように特に設計されています。最後に、提案された方法は、マルチレベルの難易度の下でマルチクラス3Dオブジェクト検出タスクのKITTIベンチマークで評価され、平均平均精度(mAP)ですべての最先端の方法よりも優れていることが示されています。ここでの私たちのアプローチが、挑戦的な歩行者クラスのKITTIリーダーボードで最初にランク付けされていることも注目に値します。
Many LiDAR-based methods for detecting large objects, single-class object detection, or under easy situations were claimed to perform quite well. However, their performances of detecting small objects or under hard situations did not surpass those of the fusion-based ones due to failure to leverage the image semantics. In order to elevate the detection performance in a complicated environment, this paper proposes a deep learning (DL)-embedded fusion-based multi-class 3D object detection network which admits both LiDAR and camera sensor data streams, named Voxel-Pixel Fusion Network (VPFNet). Inside this network, a key novel component is called Voxel-Pixel Fusion (VPF) layer, which takes advantage of the geometric relation of a voxel-pixel pair and fuses the voxel features and the pixel features with proper mechanisms. Moreover, several parameters are particularly designed to guide and enhance the fusion effect after considering the characteristics of a voxel-pixel pair. Finally, the proposed method is evaluated on the KITTI benchmark for multi-class 3D object detection task under multilevel difficulty, and is shown to outperform all state-of-the-art methods in mean average precision (mAP). It is also noteworthy that our approach here ranks the first on the KITTI leaderboard for the challenging pedestrian class.
updated: Mon Nov 01 2021 14:17:09 GMT+0000 (UTC)
published: Mon Nov 01 2021 14:17:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト