オブジェクト検出のための最近の深層学習方法は、大量の境界ボックス注釈に依存しています。これらの注釈の収集は手間と費用がかかりますが、異なる分布の画像をテストする場合、監視モデルは一般化されません。ドメイン適応は、既存のラベルをターゲットテストデータに適応させることでソリューションを提供します。ただし、ドメイン間に大きなギャップがあると、適応が困難なタスクになり、不安定なトレーニングプロセスと次善の結果につながる可能性があります。この論文では、ドメインギャップを中間ドメインに橋渡しし、より簡単な適応サブタスクを徐々に解決することを提案します。この中間ドメインは、ソースイメージを翻訳してターゲットドメインのイメージを模倣することにより構築されます。ドメインシフトの問題に取り組むために、敵対的学習を採用して、機能レベルで分布を調整します。さらに、中間ドメインでの不均衡な画像品質に対処するために、加重タスク損失が適用されます。実験結果は、ターゲットドメインでのパフォーマンスの観点から、本手法が最先端の手法よりも優れていることを示しています。
Recent deep learning methods for object detection rely on a large amount of bounding box annotations. Collecting these annotations is laborious and costly, yet supervised models do not generalize well when testing on images from a different distribution. Domain adaptation provides a solution by adapting existing labels to the target testing data. However, a large gap between domains could make adaptation a challenging task, which leads to unstable training processes and sub-optimal results. In this paper, we propose to bridge the domain gap with an intermediate domain and progressively solve easier adaptation subtasks. This intermediate domain is constructed by translating the source images to mimic the ones in the target domain. To tackle the domain-shift problem, we adopt adversarial learning to align distributions at the feature level. In addition, a weighted task loss is applied to deal with unbalanced image quality in the intermediate domain. Experimental results show that our method performs favorably against the state-of-the-art method in terms of the performance on the target domain.