arXiv reaDer
ソースフリーの教師なしドメイン適応3Dオブジェクト検出のための注意深いプロトタイプ
Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D Object Detection
3Dオブジェクト検出ネットワークは、トレーニングされたデータに偏る傾向があります。トレーニング(ソース)データとは異なる場所、条件、またはセンサーでキャプチャされたデータセットを評価すると、テスト(またはターゲット)データとの分布のギャップにより、モデルのパフォーマンスが低下します。ドメイン適応の現在の方法は、トレーニング中にソースデータへのアクセスを想定していますが、プライバシーやメモリの問題のために利用できない場合があります。または、入力としてLIDARフレームのシーケンスが必要です。クラスプロトタイプを使用して疑似ラベルノイズの影響を軽減する、LIDARベースの3Dオブジェクト検出器のソースフリーの教師なしドメイン適応のための単一フレームアプローチを提案します。ノイズの多いラベルが存在する場合のプロトタイプ計算の従来の機能集約方法の制限に対処するために、トランスフォーマーモジュールを使用して、誤った、信頼性の高いアノテーションに対応する外れ値ROIを特定し、注意深いクラスプロトタイプを計算します。反復トレーニング戦略では、ノイズの多い疑似ラベルに関連する損失が軽減され、自己トレーニングの過程で改善されます。提案されたアプローチの有効性を検証するために、ラベルが豊富な大規模なデータセット(Waymo Open DatasetやnuScenesなど)でトレーニングされたネットワークに関連するドメインシフトを調べ、ラベルが少ない小規模なデータセット(KITTIなど)で評価します。逆に。最近の2つのオブジェクト検出器でのアプローチを示し、他のドメイン適応作業よりも優れた結果を達成します。
3D object detection networks tend to be biased towards the data they are trained on. Evaluation on datasets captured in different locations, conditions or sensors than that of the training (source) data results in a drop in model performance due to the gap in distribution with the test (or target) data. Current methods for domain adaptation either assume access to source data during training, which may not be available due to privacy or memory concerns, or require a sequence of lidar frames as an input. We propose a single-frame approach for source-free, unsupervised domain adaptation of lidar-based 3D object detectors that uses class prototypes to mitigate the effect pseudo-label noise. Addressing the limitations of traditional feature aggregation methods for prototype computation in the presence of noisy labels, we utilize a transformer module to identify outlier ROI's that correspond to incorrect, over-confident annotations, and compute an attentive class prototype. Under an iterative training strategy, the losses associated with noisy pseudo labels are down-weighed and thus refined in the process of self-training. To validate the effectiveness of our proposed approach, we examine the domain shift associated with networks trained on large, label-rich datasets (such as the Waymo Open Dataset and nuScenes) and evaluate on smaller, label-poor datasets (such as KITTI) and vice-versa. We demonstrate our approach on two recent object detectors and achieve results that out-perform the other domain adaptation works.
updated: Wed Dec 01 2021 16:28:20 GMT+0000 (UTC)
published: Tue Nov 30 2021 18:42:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト