arXiv reaDer
蒸留と微調整:ブラックボックスソースモデルからの効果的な適応
Distill and Fine-tune: Effective Adaptation from a Black-box Source Model
ラベル付けの負担を軽減するために、教師なしドメイン適応(UDA)は、以前に関連したラベル付きデータセット(ソース)の知識を新しいラベルなしデータセット(ターゲット)に転送することを目的としています。目覚ましい進歩にもかかわらず、以前の方法は常に生のソースデータにアクセスし、データに依存するアラインメントアプローチを開発して、トランスダクティブ学習方法でターゲットサンプルを認識する必要があります。これにより、ソース個人からプライバシーの懸念が生じる可能性があります。最近のいくつかの研究では、ソースドメインからの生データの代わりに、十分にトレーニングされたホワイトボックスモデルを利用することで代替ソリューションに頼っていますが、生成的敵対的トレーニングによって生データが漏洩する可能性があります。このホワイトペーパーでは、UDAの実用的で興味深い設定について説明します。この設定では、ターゲットドメインでの適応中に、ブラックボックスソースモデルのみ(つまり、ネットワーク予測のみが利用可能)が提供されます。さらに、さまざまなニューラルネットワークをさまざまなドメインに使用することもできます。この新しい問題に対して、Distill and Fine-tune(Dis-tune)と呼ばれる新しい2段階の適応フレームワークを提案します。具体的には、Dis-tuneは、最初にソースモデルからカスタマイズされたターゲットモデルに知識を構造的に抽出し、次に、ターゲットドメインに合うように、監視なしで抽出されたモデルを微調整します。有効性を検証するために、2つのUDAシナリオ(つまり、閉集合と部分集合)を検討し、Dis-tuneが最先端のアプローチに対して非常に競争力のあるパフォーマンスを実現することを発見しました。
To alleviate the burden of labeling, unsupervised domain adaptation (UDA) aims to transfer knowledge in previous related labeled datasets (source) to a new unlabeled dataset (target). Despite impressive progress, prior methods always need to access the raw source data and develop data-dependent alignment approaches to recognize the target samples in a transductive learning manner, which may raise privacy concerns from source individuals. Several recent studies resort to an alternative solution by exploiting the well-trained white-box model instead of the raw data from the source domain, however, it may leak the raw data through generative adversarial training. This paper studies a practical and interesting setting for UDA, where only a black-box source model (i.e., only network predictions are available) is provided during adaptation in the target domain. Besides, different neural networks are even allowed to be employed for different domains. For this new problem, we propose a novel two-step adaptation framework called Distill and Fine-tune (Dis-tune). Specifically, Dis-tune first structurally distills the knowledge from the source model to a customized target model, then unsupervisedly fine-tunes the distilled model to fit the target domain. To verify the effectiveness, we consider two UDA scenarios (i.e. , closed-set and partial-set), and discover that Dis-tune achieves highly competitive performance to state-of-the-art approaches.
updated: Sun Apr 04 2021 05:29:05 GMT+0000 (UTC)
published: Sun Apr 04 2021 05:29:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト