arXiv reaDer
Head2Toe:より良い伝達学習のための中間表現の利用
Head2Toe: Utilizing Intermediate Representations for Better Transfer Learning
転送学習方法は、データが豊富なソースドメインで事前トレーニングされたモデルを使用して、データが不足しているターゲットドメインのパフォーマンスを向上させることを目的としています。費用対効果の高い戦略である線形プロービングには、ソースモデルをフリーズし、ターゲットドメインの新しい分類ヘッドをトレーニングすることが含まれます。この戦略は、よりコストがかかるが最先端の方法(ソースモデルのすべてのパラメーターをターゲットドメインに微調整する)よりも優れています。これは、微調整により、モデルが中間層からの有用な情報を活用できるためです。それ以外の場合は、後の事前トレーニングされたレイヤーによって破棄されます。これらの中間層が直接利用される可能性があるという仮説を検討します。ソースモデルのすべてのレイヤーから特徴を選択してターゲットドメインの分類ヘッドをトレーニングする方法、Head-to-Toeプロービング(Head2Toe)を提案します。 VTAB-1kの評価では、Head2Toeは、トレーニングとストレージのコストを100分の1以上削減しながら、平均して微調整で得られたパフォーマンスと一致しますが、重要なことに、配布外転送の場合、Head2Toeは微調整よりも優れています。
Transfer-learning methods aim to improve performance in a data-scarce target domain using a model pretrained on a data-rich source domain. A cost-efficient strategy, linear probing, involves freezing the source model and training a new classification head for the target domain. This strategy is outperformed by a more costly but state-of-the-art method -- fine-tuning all parameters of the source model to the target domain -- possibly because fine-tuning allows the model to leverage useful information from intermediate layers which is otherwise discarded by the later pretrained layers. We explore the hypothesis that these intermediate layers might be directly exploited. We propose a method, Head-to-Toe probing (Head2Toe), that selects features from all layers of the source model to train a classification head for the target-domain. In evaluations on the VTAB-1k, Head2Toe matches performance obtained with fine-tuning on average while reducing training and storage cost hundred folds or more, but critically, for out-of-distribution transfer, Head2Toe outperforms fine-tuning.
updated: Mon Jan 10 2022 18:40:07 GMT+0000 (UTC)
published: Mon Jan 10 2022 18:40:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト