トレーニングデータとテストデータが異なるドメイン、たとえば異なるスタイルからのものである場合、オブジェクト検出のほとんどの最先端の方法は、一般化能力が低いという問題があります。この問題に対処するために、以前の方法では主に全体論的表現を使用して、異なるドメインの機能レベルとピクセルレベルの分布を調整します。これにより、画像内のオブジェクトのインスタンスレベルの特性が無視される可能性があります。さらに、異なるドメイン間で検出機能を転送する場合、ドメイン固有のスタイルではなく、ドメイン不変のインスタンスレベルの機能を取得することが重要です。したがって、インスタンス不変の特徴を抽出するには、ドメイン固有の特徴からドメイン不変の特徴を解きほぐす必要があります。この目的のために、ドメイン適応オブジェクト検出を解決するために、プログレッシブ解きほぐされたフレームワークが最初に提案されます。特に、特徴分解に使用される解きほぐされた学習に基づいて、ドメイン不変およびドメイン固有の特徴を分解するために、2つの解きほぐされた層を考案します。また、インスタンス不変の特徴は、ドメイン不変の特徴に基づいて抽出されます。最後に、解きほぐしを強化するために、モデルを最適化するために、複数の損失関数を含む3段階のトレーニングメカニズムが考案されています。実験では、3つのドメインシフトシーンでの方法の有効性を検証します。私たちの方法は、ベースラインの方法saito2019strongよりも個別に2.3%、3.6%、4.0%高くなっています。
Most state-of-the-art methods of object detection suffer from poor generalization ability when the training and test data are from different domains, e.g., with different styles. To address this problem, previous methods mainly use holistic representations to align feature-level and pixel-level distributions of different domains, which may neglect the instance-level characteristics of objects in images. Besides, when transferring detection ability across different domains, it is important to obtain the instance-level features that are domain-invariant, instead of the styles that are domain-specific. Therefore, in order to extract instance-invariant features, we should disentangle the domain-invariant features from the domain-specific features. To this end, a progressive disentangled framework is first proposed to solve domain adaptive object detection. Particularly, base on disentangled learning used for feature decomposition, we devise two disentangled layers to decompose domain-invariant and domain-specific features. And the instance-invariant features are extracted based on the domain-invariant features. Finally, to enhance the disentanglement, a three-stage training mechanism including multiple loss functions is devised to optimize our model. In the experiment, we verify the effectiveness of our method on three domain-shift scenes. Our method is separately 2.3%, 3.6%, and 4.0% higher than the baseline method saito2019strong.