現在の最先端のオブジェクト検出器は、トレーニングデータとのドメインギャップが原因で、野外で展開するとパフォーマンスが大幅に低下する可能性があります。 Unsupervised Domain Adaptation(UDA)は、高価なラベルコストなしでモデルを新しいドメイン/環境に適応させる有望なアプローチです。ただし、グラウンドトゥルースラベルがない場合、UDAでのオブジェクト検出タスクに関する以前のほとんどの作業では、敵対的学習方法を使用して、粗い画像レベルおよび/または機能レベルの適応のみを実行できます。この作業では、このような敵対ベースの方法はドメインスタイルのギャップを減らすことしかできないが、オブジェクト検出器にとって重要であることが示されているドメインコンテンツの分布のギャップに対処できないことを示します。この制限を克服するために、高品質の疑似ラベルを活用してターゲットドメインからより適切な表現を直接学習することにより、クロスドメイン半教師あり学習(CDSSL)フレームワークを提案します。クロスドメインオブジェクト検出でSSLを有効にするには、きめの細かいドメイン転送、プログレッシブコンフィデンスベースのラベルシャープニング、および不均衡サンプリング戦略を提案して、2つの課題に対処します:(i)ソースとターゲットドメインデータ間の非同一分布、(ii )標的ドメインでのノイズの多い擬似ラベリングによるエラー増幅/蓄積。実験結果は、提案されたアプローチが、さまざまなドメインギャップシナリオで一貫して新しい最先端のパフォーマンス(mAPでの従来のベストワークより2.2%-9.5%向上)を達成することを示しています。コードがリリースされます。
Current state-of-the-art object detectors can have significant performance drop when deployed in the wild due to domain gaps with training data. Unsupervised Domain Adaptation (UDA) is a promising approach to adapt models for new domains/environments without any expensive label cost. However, without ground truth labels, most prior works on UDA for object detection tasks can only perform coarse image-level and/or feature-level adaptation by using adversarial learning methods. In this work, we show that such adversarial-based methods can only reduce the domain style gap, but cannot address the domain content distribution gap that is shown to be important for object detectors. To overcome this limitation, we propose the Cross-Domain Semi-Supervised Learning (CDSSL) framework by leveraging high-quality pseudo labels to learn better representations from the target domain directly. To enable SSL for cross-domain object detection, we propose fine-grained domain transfer, progressive-confidence-based label sharpening and imbalanced sampling strategy to address two challenges: (i) non-identical distribution between source and target domain data, (ii) error amplification/accumulation due to noisy pseudo labeling on the target domain. Experiment results show that our proposed approach consistently achieves new state-of-the-art performance (2.2% - 9.5% better than prior best work on mAP) under various domain gap scenarios. The code will be released.