arXiv reaDer
超疎 3D オブジェクト検出
Super Sparse 3D Object Detection
LiDAR の認識範囲が拡大するにつれて、LiDAR ベースの 3D オブジェクト検出は、自動運転における長距離認識にこれまで以上に貢献します。主流の 3D オブジェクト検出器は、多くの場合、コストが知覚範囲の 2 次である高密度の特徴マップを構築するため、長距離設定にスケールアップすることはほとんどありません。効率的な長距離検出を可能にするために、最初に FSD と呼ばれる完全に疎なオブジェクト検出器を提案します。 FSD は、一般的なスパース ボクセル エンコーダーと新しいスパース インスタンス認識 (SIR) モジュールに基づいて構築されています。 SIR はポイントをインスタンスにグループ化し、非常に効率的なインスタンスごとの特徴抽出を適用します。インスタンスごとのグループ化は、完全にまばらなアーキテクチャの設計を妨げる中心機能の欠落の問題を回避します。完全なスパース特性の利点をさらに享受するために、時間情報を活用してデータの冗長性を取り除き、FSD++ という超スパース検出器を提案します。 FSD++ は最初に残差ポイントを生成します。これは、連続するフレーム間のポイントの変化を示します。残りのポイントは、前のいくつかの前景ポイントとともに、非常にまばらな入力データを形成し、データの冗長性と計算オーバーヘッドを大幅に削減します。大規模な Waymo Open Dataset でメソッドを包括的に分析し、最先端のパフォーマンスが報告されています。長距離検出における私たちの方法の優位性を示すために、知覚範囲 (200m) が Waymo オープン データセット (75m) よりもはるかに大きい Argoverse 2 データセットでも実験を行います。コードは https://github.com/tusen-ai/SST でオープンソース化されています。
As the perception range of LiDAR expands, LiDAR-based 3D object detection contributes ever-increasingly to the long-range perception in autonomous driving. Mainstream 3D object detectors often build dense feature maps, where the cost is quadratic to the perception range, making them hardly scale up to the long-range settings. To enable efficient long-range detection, we first propose a fully sparse object detector termed FSD. FSD is built upon the general sparse voxel encoder and a novel sparse instance recognition (SIR) module. SIR groups the points into instances and applies highly-efficient instance-wise feature extraction. The instance-wise grouping sidesteps the issue of the center feature missing, which hinders the design of the fully sparse architecture. To further enjoy the benefit of fully sparse characteristic, we leverage temporal information to remove data redundancy and propose a super sparse detector named FSD++. FSD++ first generates residual points, which indicate the point changes between consecutive frames. The residual points, along with a few previous foreground points, form the super sparse input data, greatly reducing data redundancy and computational overhead. We comprehensively analyze our method on the large-scale Waymo Open Dataset, and state-of-the-art performance is reported. To showcase the superiority of our method in long-range detection, we also conduct experiments on Argoverse 2 Dataset, where the perception range (200m) is much larger than Waymo Open Dataset (75m). Code is open-sourced at https://github.com/tusen-ai/SST.
updated: Thu Jan 05 2023 17:03:56 GMT+0000 (UTC)
published: Thu Jan 05 2023 17:03:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト