arXiv reaDer
MSF: ポイント クラウド シーケンスからの効率的な 3D オブジェクト検出のためのモーション ガイド付きシーケンシャル フュージョン
MSF: Motion-guided Sequential Fusion for Efficient 3D Object Detection from Point Cloud Sequences
点群シーケンスは、自動運転などのアプリケーションで 3D オブジェクトを正確に検出するためによく使用されます。現在の最高性能のマルチフレーム検出器は、ほとんどが Detect-and-Fuse フレームワークに従います。これは、シーケンスの各フレームから特徴を抽出し、それらを融合して現在のフレーム内のオブジェクトを検出します。ただし、隣接するフレームは高度に相関しているため、これは必然的に冗長な計算につながります。この論文では、現在のフレームでのオブジェクト検出に役立つシーケンシャル コンテキストをマイニングするためにオブジェクト モーションの連続性を利用する、効率的なモーション ガイド付きシーケンシャル フュージョン (MSF) メソッドを提案します。最初に現在のフレームで 3D 提案を生成し、推定された速度に基づいてそれらを前のフレームに伝播します。次に、関心のあるポイントがシーケンスからプールされ、提案機能としてエンコードされます。フレーム全体での提案機能の相互作用を容易にするために、新しい双方向機能集約(BiFA)モジュールがさらに提案されています。さらに、ボクセルベースのサンプリング手法によって点群のプールを最適化し、数ミリ秒で数百万の点を処理できるようにします。提案された MSF メソッドは、他のマルチフレーム検出器よりも優れた効率を達成するだけでなく、Waymo Open Dataset の LEVEL1 および LEVEL2 テスト セットでそれぞれ 83.12% および 78.30% の mAP という最高の精度を実現します。コードは https://github.com/skyhehe123/MSF にあります。
Point cloud sequences are commonly used to accurately detect 3D objects in applications such as autonomous driving. Current top-performing multi-frame detectors mostly follow a Detect-and-Fuse framework, which extracts features from each frame of the sequence and fuses them to detect the objects in the current frame. However, this inevitably leads to redundant computation since adjacent frames are highly correlated. In this paper, we propose an efficient Motion-guided Sequential Fusion (MSF) method, which exploits the continuity of object motion to mine useful sequential contexts for object detection in the current frame. We first generate 3D proposals on the current frame and propagate them to preceding frames based on the estimated velocities. The points-of-interest are then pooled from the sequence and encoded as proposal features. A novel Bidirectional Feature Aggregation (BiFA) module is further proposed to facilitate the interactions of proposal features across frames. Besides, we optimize the point cloud pooling by a voxel-based sampling technique so that millions of points can be processed in several milliseconds. The proposed MSF method achieves not only better efficiency than other multi-frame detectors but also leading accuracy, with 83.12% and 78.30% mAP on the LEVEL1 and LEVEL2 test sets of Waymo Open Dataset, respectively. Codes can be found at https://github.com/skyhehe123/MSF.
updated: Wed Mar 15 2023 02:10:27 GMT+0000 (UTC)
published: Wed Mar 15 2023 02:10:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト