arXiv reaDer
半教師ありドメイン適応の不変表現とリスクの学習
Learning Invariant Representations and Risks for Semi-supervised Domain Adaptation
教師あり学習の成功は、トレーニングデータとテストデータが同じ基礎となる分布からのものであるという仮定にかかっています。これは、分布がシフトする可能性があるため、実際には有効でないことがよくあります。これに照らして、教師なしドメイン適応のためのほとんどの既存の方法は、ドメイン不変表現と小さなソースドメインエラーを達成することに焦点を合わせています。ただし、最近の研究では、これはターゲットドメインでの適切な一般化を保証するには不十分であり、実際、ラベル配布のシフトの下では明らかに有害であることが示されています。さらに、多くの実際のアプリケーションでは、ターゲットドメインから少量のラベル付きデータを取得し、それらを使用してソースデータを使用したモデルトレーニングを容易にすることがしばしば可能です。上記の観察に触発されて、この論文では、半教師ありドメイン適応(Semi-DA)の設定の下で不変表現とリスクを同時に学習することを目的とした最初の方法を提案します。まず、Semi-DAでの分類と回帰の両方の問題に対応する有限サンプルを提供します。限界は、ターゲットの一般化を取得するための原則的な方法を示唆しています。つまり、特徴空間のドメイン間で周辺分布と条件付き分布の両方を調整することです。これに動機付けられて、次に、不変表現とリスクを共同で学習するためのLIRRアルゴリズムを紹介します。最後に、分類タスクと回帰タスクの両方で広範な実験が行われ、LIRRが不変の表現または不変のリスクのみを学習する方法と比較して、最先端のパフォーマンスと大幅な改善を一貫して達成していることを示しています。
The success of supervised learning hinges on the assumption that the training and test data come from the same underlying distribution, which is often not valid in practice due to potential distribution shift. In light of this, most existing methods for unsupervised domain adaptation focus on achieving domain-invariant representations and small source domain error. However, recent works have shown that this is not sufficient to guarantee good generalization on the target domain, and in fact, is provably detrimental under label distribution shift. Furthermore, in many real-world applications it is often feasible to obtain a small amount of labeled data from the target domain and use them to facilitate model training with source data. Inspired by the above observations, in this paper we propose the first method that aims to simultaneously learn invariant representations and risks under the setting of semi-supervised domain adaptation (Semi-DA). First, we provide a finite sample bound for both classification and regression problems under Semi-DA. The bound suggests a principled way to obtain target generalization, i.e. by aligning both the marginal and conditional distributions across domains in feature space. Motivated by this, we then introduce the LIRR algorithm for jointly Learning Invariant Representations and Risks. Finally, extensive experiments are conducted on both classification and regression tasks, which demonstrates LIRR consistently achieves state-of-the-art performance and significant improvements compared with the methods that only learn invariant representations or invariant risks.
updated: Sun Apr 04 2021 18:10:56 GMT+0000 (UTC)
published: Fri Oct 09 2020 15:42:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト