データとモデルは、間違いなく LiDAR 物体検出の 2 つの支柱です。しかし、データ中心の取り組みは、増え続ける派手な新しいモデルのリストに比べるとはるかに遅れています。この研究では、生成されたデータ サンプルに対して最大限の制御性を提供する合成ベースの LiDAR データ拡張アプローチ (いわゆる GT-Aug) を体系的に研究します。私たちは、既存の研究の主な欠点を、GT-8月中に非現実的なLiDARスキャンパターンを導入していることであると特定しました。この発見を踏まえて、私たちはリアルな LiDAR スキャンの生成を優先する合成ベースの拡張手法である Real-Aug を提案します。私たちの方法は、合成の詳細を処理する現実に準拠したシーン合成モジュールと、合成データから実際のデータ分布にデータ分布を徐々に適応させる現実合成混合トレーニング戦略で構成されます。私たちの方法の有効性を検証するために、広範なアブレーション研究を実施し、検出器とデータセットの幅広い組み合わせで提案された Real-Aug を検証します。 nuScenes テスト セットでは、最先端の 0.744 NDS と 0.702 mAP を達成しました。コードは近々公開される予定です。
Data and model are the undoubtable two supporting pillars for LiDAR object detection. However, data-centric works have fallen far behind compared with the ever-growing list of fancy new models. In this work, we systematically study the synthesis-based LiDAR data augmentation approach (so-called GT-Aug) which offers maxium controllability over generated data samples. We pinpoint the main shortcoming of existing works is introducing unrealistic LiDAR scan patterns during GT-Aug. In light of this finding, we propose Real-Aug, a synthesis-based augmentation method which prioritizes on generating realistic LiDAR scans. Our method consists a reality-conforming scene composition module which handles the details of the composition and a real-synthesis mixing up training strategy which gradually adapts the data distribution from synthetic data to the real one. To verify the effectiveness of our methods, we conduct extensive ablation studies and validate the proposed Real-Aug on a wide combination of detectors and datasets. We achieve a state-of-the-art 0.744 NDS and 0.702 mAP on nuScenes test set. The code shall be released soon.