ターゲットドメインでのラベルの放棄により、教師なしドメイン適応(UDA)は多くの実際のアプリケーションで魅力的な手法になりますが、ラベル付きのターゲットデータがないとモデルの適応が難しくなるため、大きな課題もあります。このホワイトペーパーでは、ターゲットドメインの事前知識からの補償を求めることでこの問題に対処します。これは、実際には、たとえば人間の専門知識から(部分的に)利用できることがよくあります。これは、トレーニングデータに加えて、ターゲットクラスの分布に関するいくつかの事前知識が利用できる、斬新でありながら実用的な設定につながります。この設定を知識誘導教師なしドメイン適応(KUDA)と呼びます。特に、ターゲットドメインのクラス分布に関する2つの特定のタイプの事前知識を検討します。個々のクラス確率の下限と上限を表す単項境界と、2つのクラス確率間の関係を記述する二項関係です。このような事前知識を使用して、モデルで生成された疑似ラベルを改良する一般的な修正モジュールを提案します。このモジュールは、事前の知識とスムーズな正則化から導き出されたゼロワンプログラミング問題として定式化されています。セルフトレーニングベースのUDAメソッドに簡単にプラグインでき、SHOTとDINEの2つの最先端メソッドと組み合わせます。 4つのベンチマークでの経験的結果は、修正モジュールが疑似ラベルの品質を明らかに改善し、それが自己トレーニング段階に役立つことを確認しています。事前の知識からのガイダンスにより、両方の方法のパフォーマンスが大幅に向上します。私たちの仕事は、UDAに事前知識を統合する際のさらなる調査を刺激することを期待しています。コードはhttps://github.com/tsun/KUDAで入手できます。
The waive of labels in the target domain makes Unsupervised Domain Adaptation (UDA) an attractive technique in many real-world applications, though it also brings great challenges as model adaptation becomes harder without labeled target data. In this paper, we address this issue by seeking compensation from target domain prior knowledge, which is often (partially) available in practice, e.g., from human expertise. This leads to a novel yet practical setting where in addition to the training data, some prior knowledge about the target class distribution are available. We term the setting as Knowledge-guided Unsupervised Domain Adaptation (KUDA). In particular, we consider two specific types of prior knowledge about the class distribution in the target domain: Unary Bound that describes the lower and upper bounds of individual class probabilities, and Binary Relationship that describes the relations between two class probabilities. We propose a general rectification module that uses such prior knowledge to refine model generated pseudo labels. The module is formulated as a Zero-One Programming problem derived from the prior knowledge and a smooth regularizer. It can be easily plugged into self-training based UDA methods, and we combine it with two state-of-the-art methods, SHOT and DINE. Empirical results on four benchmarks confirm that the rectification module clearly improves the quality of pseudo labels, which in turn benefits the self-training stage. With the guidance from prior knowledge, the performances of both methods are substantially boosted. We expect our work to inspire further investigations in integrating prior knowledge in UDA. Code is available at https://github.com/tsun/KUDA.