データ拡張は、データ効率を改善し、点群での 3D 検出のラベリング コストを節約するための重要な手法です。しかし、既存の拡張ポリシーはこれまで、ラベル付きデータのみを利用するように設計されており、データの多様性が制限されています。このホワイトペーパーでは、疑似ラベル付けとデータ拡張が補完的であることを認識しているため、ラベル付けされていないデータをデータ拡張に活用してトレーニングデータを充実させることを提案します。特に、フレーム (PseudoFrame)、オブジェクト (PseudoBBox)、および背景 (PseudoBackground) を含む、ラベル付けされたシーンと擬似ラベル付けされたシーンの両方を融合するために、3 つの新しい擬似ラベル ベースのデータ拡張ポリシー (PseudoAugments) を設計します。 PseudoAugments は、擬似ラベリング エラーを軽減し、多様な融合トレーニング シーンを生成することにより、擬似ラベリングよりも優れています。ポイントベースおよびボクセルベースのアーキテクチャ、異なるモデル容量、および KITTI と Waymo オープン データセットの両方にわたって PseudoAugments が一般化されることを示します。ハイパーパラメーターの調整と反復的な疑似ラベル付けのコストを軽減するために、AutoPseudoAugment という名前の 3D 検出用の人口ベースのデータ拡張フレームワークを開発しました。擬似ラベリングをオフラインで実行する以前の作業とは異なり、私たちのフレームワークは、計算コストを削減するために PseudoAugments とハイパーパラメータ調整を 1 回で実行します。大規模な Waymo Open Dataset での実験結果は、私たちの方法が最先端の自動データ拡張方法 (PPBA) および自己訓練方法 (疑似ラベリング) よりも優れていることを示しています。特に、AutoPseudoAugment は、先行技術と比較して、車両および歩行者のタスクで約 3 倍および 2 倍のデータ効率です。特に、AutoPseudoAugment は、完全なデータセットのトレーニング結果とほぼ一致しており、車両検出タスクでラベル付けされた実行セグメントのわずか 10% しかありません。
Data augmentation is an important technique to improve data efficiency and save labeling cost for 3D detection in point clouds. Yet, existing augmentation policies have so far been designed to only utilize labeled data, which limits the data diversity. In this paper, we recognize that pseudo labeling and data augmentation are complementary, thus propose to leverage unlabeled data for data augmentation to enrich the training data. In particular, we design three novel pseudo-label based data augmentation policies (PseudoAugments) to fuse both labeled and pseudo-labeled scenes, including frames (PseudoFrame), objecta (PseudoBBox), and background (PseudoBackground). PseudoAugments outperforms pseudo labeling by mitigating pseudo labeling errors and generating diverse fused training scenes. We demonstrate PseudoAugments generalize across point-based and voxel-based architectures, different model capacity and both KITTI and Waymo Open Dataset. To alleviate the cost of hyperparameter tuning and iterative pseudo labeling, we develop a population-based data augmentation framework for 3D detection, named AutoPseudoAugment. Unlike previous works that perform pseudo-labeling offline, our framework performs PseudoAugments and hyperparameter tuning in one shot to reduce computational cost. Experimental results on the large-scale Waymo Open Dataset show our method outperforms state-of-the-art auto data augmentation method (PPBA) and self-training method (pseudo labeling). In particular, AutoPseudoAugment is about 3X and 2X data efficient on vehicle and pedestrian tasks compared to prior arts. Notably, AutoPseudoAugment nearly matches the full dataset training results, with just 10% of the labeled run segments on the vehicle detection task.