arXiv reaDer
プロトタイプの整合性と一貫性の学習による半教師ありドメインの適応
Semi-Supervised Domain Adaptation with Prototypical Alignment and Consistency Learning
ドメイン適応は、ドメインシフトを伴うドメイン間でのモデルの一般化可能性を強化します。ほとんどの研究努力は、ラベル付きソースデータおよびラベルなしターゲットデータと共同でモデルをトレーニングする教師なしドメイン適応(UDA)に費やされてきました。このホワイトペーパーでは、さらにいくつかのターゲットサンプル(たとえば、クラスごとに1つのサンプル)にラベルを付けた場合に、ドメインシフトに対処するのにどの程度役立つかを調査します。これはいわゆる半教師ありドメイン適応(SSDA)の問題であり、ラベル付けされたいくつかのターゲットサンプルは「ランドマーク」と呼ばれます。ランドマークの可能性を最大限に引き出すために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込みます。次に、ソースサンプルが同じクラスのターゲットプロトタイプと整列されます。ラベルの不足をさらに軽減するために、データ拡張ベースのソリューションを提案します。具体的には、ラベル付けされた画像をひどく混乱させ、PAを達成するのが簡単ではないようにして、モデルの一般化を促進します。さらに、光変換と強い変換で各画像を摂動させることにより、ラベルのないターゲット画像に一貫性学習を適用します。次に、強く摂動された画像は、軽く摂動された画像から推測された疑似ラベルを使用して、「監視されたような」トレーニングを楽しむことができます。実験によると、提案された方法は単純ですが、最先端の方法よりも大幅にパフォーマンスが向上し、さまざまな既存のUDAメソッドのプラグアンドプレイコンポーネントとして機能し、適応パフォーマンスを向上させることができるという柔軟性を享受しています。ランドマークが提供されます。私たちのコードはhttps://github.com/kailigo/paclで入手できます。
Domain adaptation enhances generalizability of a model across domains with domain shifts. Most research effort has been spent on Unsupervised Domain Adaption (UDA) which trains a model jointly with labeled source data and unlabeled target data. This paper studies how much it can help address domain shifts if we further have a few target samples (e.g., one sample per class) labeled. This is the so-called semi-supervised domain adaptation (SSDA) problem and the few labeled target samples are termed as ``landmarks''. To explore the full potential of landmarks, we incorporate a prototypical alignment (PA) module which calculates a target prototype for each class from the landmarks; source samples are then aligned with the target prototype from the same class. To further alleviate label scarcity, we propose a data augmentation based solution. Specifically, we severely perturb the labeled images, making PA non-trivial to achieve and thus promoting model generalizability. Moreover, we apply consistency learning on unlabeled target images, by perturbing each image with light transformations and strong transformations. Then, the strongly perturbed image can enjoy ``supervised-like'' training using the pseudo label inferred from the lightly perturbed one. Experiments show that the proposed method, though simple, reaches significant performance gains over state-of-the-art methods, and enjoys the flexibility of being able to serve as a plug-and-play component to various existing UDA methods and improve adaptation performance with landmarks provided. Our code is available at https://github.com/kailigo/pacl.
updated: Mon Apr 19 2021 08:46:08 GMT+0000 (UTC)
published: Mon Apr 19 2021 08:46:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト