arXiv reaDer
教師なしドメイン適応のための転送可能なパラメータの学習
Learning Transferable Parameters for Unsupervised Domain Adaptation
教師なしドメイン適応(UDA)を使用すると、学習マシンは、分布シフトの下で、ラベル付きソースドメインからラベルなしドメインに適応できます。ディープニューラルネットワークの強力な表現能力のおかげで、UDAでの最近の目覚ましい成果は、ドメイン不変の特徴の学習に頼っています。直感的には、ソースドメインから学習した仮説とともに、優れた機能表現がターゲットドメインにうまく一般化できることが期待されます。ただし、ドメイン不変の機能とソース仮説の学習プロセスには、必然的に、ターゲットドメインでのUDAモデルの一般化可能性を低下させるドメイン固有の情報が含まれます。この論文では、部分的なパラメータのみが一般化に不可欠であるという宝くじの仮説に動機付けられて、ドメイン不変情報を学習し、UDAでうまく一般化するために部分的なパラメータのみが不可欠であることがわかりました。このようなパラメータは、転送可能なパラメータと呼ばれます。対照的に、他のパラメータはドメイン固有の詳細に適合する傾向があり、一般化に失敗することがよくあります。これを転送不可能なパラメータと呼びます。この洞察に基づいて、学習プロセスでドメイン固有の情報によってもたらされる副作用を減らし、ドメイン不変情報の記憶を強化するために、Transferable Parameter Learning(TransPar)を提案します。具体的には、分布の不一致の程度に応じて、各トレーニングの反復ですべてのパラメーターを転送可能なパラメーターと転送不可能なパラメーターに分割します。次に、2つのタイプのパラメーターに対して個別の更新ルールを実行します。画像分類と回帰タスク(キーポイント検出)に関する広範な実験は、TransParが従来技術よりも重要なマージンで優れていることを示しています。さらに、実験により、TransParは最も人気のあるディープUDAネットワークに統合でき、データ分散シフトのシナリオを処理するために簡単に拡張できることが実証されています。
Unsupervised domain adaptation (UDA) enables a learning machine to adapt from a labeled source domain to an unlabeled domain under the distribution shift. Thanks to the strong representation ability of deep neural networks, recent remarkable achievements in UDA resort to learning domain-invariant features. Intuitively, the hope is that a good feature representation, together with the hypothesis learned from the source domain, can generalize well to the target domain. However, the learning processes of domain-invariant features and source hypothesis inevitably involve domain-specific information that would degrade the generalizability of UDA models on the target domain. In this paper, motivated by the lottery ticket hypothesis that only partial parameters are essential for generalization, we find that only partial parameters are essential for learning domain-invariant information and generalizing well in UDA. Such parameters are termed transferable parameters. In contrast, the other parameters tend to fit domain-specific details and often fail to generalize, which we term as untransferable parameters. Driven by this insight, we propose Transferable Parameter Learning (TransPar) to reduce the side effect brought by domain-specific information in the learning process and thus enhance the memorization of domain-invariant information. Specifically, according to the distribution discrepancy degree, we divide all parameters into transferable and untransferable ones in each training iteration. We then perform separate updates rules for the two types of parameters. Extensive experiments on image classification and regression tasks (keypoint detection) show that TransPar outperforms prior arts by non-trivial margins. Moreover, experiments demonstrate that TransPar can be integrated into the most popular deep UDA networks and be easily extended to handle any data distribution shift scenarios.
updated: Fri Aug 13 2021 09:09:15 GMT+0000 (UTC)
published: Fri Aug 13 2021 09:09:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト