arXiv reaDer
トレーニング前のデータをより適切に活用することによる微調整の改善
Improved Fine-Tuning by Better Leveraging Pre-Training Data
主要なパラダイムとして、ターゲットデータに対して事前にトレーニングされたモデルを微調整することは、多くの深層学習アプリケーション、特に小さなデータセットで広く使用されています。ただし、最近の研究では、一部のビジョンタスクでトレーニングサンプルの数を増やすと、ゼロからのトレーニングの最終的なパフォーマンスは、この事前トレーニング戦略よりも悪くないことが経験的に示されています。本研究では、学習理論で一般的な過剰リスク限界を用いて、一般化分析の観点からこの現象を再検討します。この結果は、超過リスク限界が事前にトレーニングされたモデルに弱い依存関係を持っている可能性があることを示しています。このデータは微調整にも利用できるため、この観察結果は、事前トレーニングデータを微調整に活用するように促します。事前トレーニングデータを使用した一般化の結果は、適切な事前トレーニングデータが微調整に含まれている場合、ターゲットタスクに制限される過剰なリスクを改善できることを示しています。理論的な動機で、ターゲットタスクの一般化を改善するのに役立つ事前トレーニングデータからサブセットを選択するための新しい選択戦略を提案します。 8つのベンチマークデータセットでの画像分類タスクの広範な実験結果は、提案されたデータ選択ベースの微調整パイプラインの有効性を検証します。
As a dominant paradigm, fine-tuning a pre-trained model on the target data is widely used in many deep learning applications, especially for small data sets. However, recent studies have empirically shown that training from scratch has the final performance that is no worse than this pre-training strategy once the number of training samples is increased in some vision tasks. In this work, we revisit this phenomenon from the perspective of generalization analysis by using excess risk bound which is popular in learning theory. The result reveals that the excess risk bound may have a weak dependency on the pre-trained model. The observation inspires us to leverage pre-training data for fine-tuning, since this data is also available for fine-tuning. The generalization result of using pre-training data shows that the excess risk bound on a target task can be improved when the appropriate pre-training data is included in fine-tuning. With the theoretical motivation, we propose a novel selection strategy to select a subset from pre-training data to help improve the generalization on the target task. Extensive experimental results for image classification tasks on 8 benchmark data sets verify the effectiveness of the proposed data selection based fine-tuning pipeline.
updated: Thu May 26 2022 03:40:41 GMT+0000 (UTC)
published: Wed Nov 24 2021 06:18:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト