arXiv reaDer
ST3D ++:3Dオブジェクト検出での教師なしドメイン適応のためのノイズ除去された自己トレーニング
ST3D++: Denoised Self-training for Unsupervised Domain Adaptation on 3D Object Detection
この論文では、ST3D ++という名前の自己トレーニング方法を紹介します。この方法では、3Dオブジェクト検出での教師なしドメイン適応のための全体的な疑似ラベルノイズ除去パイプラインを使用します。 ST3D ++は、疑似ラベル生成のノイズを低減するとともに、モデルトレーニングに対するノイズの多い疑似ラベルの悪影響を軽減することを目的としています。まず、ST3D ++は、ソースドメインのオブジェクトスケールバイアスから生じるターゲットドメインの疑似ラベルノイズを低減するように設計されたランダムオブジェクトスケーリング(ROS)を使用して、ラベル付きソースドメインで3Dオブジェクト検出器を事前トレーニングします。次に、疑似ラベルの生成と疑似ラベル付きターゲットドメインデータを使用したオブジェクト検出器のトレーニングを交互に行うことで、検出器が徐々に改善されます。ここでは、疑似ラベル生成プロセスにハイブリッド品質認識トリプレットメモリを装備して、生成された疑似ラベルの品質と安定性を向上させます。一方、モデルトレーニング段階では、ノイズの多い勾配方向を効果的に修正し、ノイズの多い疑似ラベル付きデータへのモデルの過剰適合を回避するために、ソースデータ支援トレーニング戦略とカリキュラムデータ拡張ポリシーを提案します。これらの特定の設計により、ノイズ除去されたトレーニング信号を使用して、細心の注意を払って洗練された疑似ラベル付きターゲットデータで検出器をトレーニングできるため、注釈を必要とせずにオブジェクト検出器をターゲットドメインに効果的に適合させることができます。最後に、私たちの方法は、3つの一般的なカテゴリ(つまり、車、歩行者、自転車)の4つの3Dベンチマークデータセット(つまり、Waymo、KITTI、Lyft、およびnuScenes)で評価されます。 ST3D ++は、評価されたすべての設定で最先端のパフォーマンスを実現し、対応するベースラインを大幅に上回ります(たとえば、AP_3Dに関してWaymo→KITTIで9.6%〜38.16%)。ターゲットを事前に使用したKITTI3Dオブジェクト検出ベンチマーク。コードが利用可能になります。
In this paper, we present a self-training method, named ST3D++, with a holistic pseudo label denoising pipeline for unsupervised domain adaptation on 3D object detection. ST3D++ aims at reducing noise in pseudo label generation as well as alleviating the negative impacts of noisy pseudo labels on model training. First, ST3D++ pre-trains the 3D object detector on the labeled source domain with random object scaling (ROS) which is designed to reduce target domain pseudo label noise arising from object scale bias of the source domain. Then, the detector is progressively improved through alternating between generating pseudo labels and training the object detector with pseudo-labeled target domain data. Here, we equip the pseudo label generation process with a hybrid quality-aware triplet memory to improve the quality and stability of generated pseudo labels. Meanwhile, in the model training stage, we propose a source data assisted training strategy and a curriculum data augmentation policy to effectively rectify noisy gradient directions and avoid model over-fitting to noisy pseudo labeled data. These specific designs enable the detector to be trained on meticulously refined pseudo labeled target data with denoised training signals, and thus effectively facilitate adapting an object detector to a target domain without requiring annotations. Finally, our method is assessed on four 3D benchmark datasets (i.e., Waymo, KITTI, Lyft, and nuScenes) for three common categories (i.e., car, pedestrian and bicycle). ST3D++ achieves state-of-the-art performance on all evaluated settings, outperforming the corresponding baseline by a large margin (e.g., 9.6% ∼ 38.16% on Waymo → KITTI in terms of AP_3D), and even surpasses the fully supervised oracle results on the KITTI 3D object detection benchmark with target prior. Code will be available.
updated: Sun Aug 15 2021 07:49:06 GMT+0000 (UTC)
published: Sun Aug 15 2021 07:49:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト