arXiv reaDer
事前トレーニングデータを活用することによる改善された微調整:理論と実践
Improved Fine-tuning by Leveraging Pre-training Data: Theory and Practice
主要なパラダイムとして、ターゲットデータで事前トレーニングされたモデルを微調整することは、多くの深層学習アプリケーション、特に小さなデータセットで広く使用されています。ただし、最近の研究では、一部のビジョンタスクでトレーニングの反復回数を増やすと、ゼロからのトレーニングの最終的なパフォーマンスは、この事前トレーニング戦略よりも悪くないことが経験的に示されています。この作品では、学習理論で人気のある一般化分析の観点からこの現象を再考します。私たちの結果は、特に大規模なトレーニングの反復の場合、最終的な予測精度が事前にトレーニングされたモデルに弱い依存性を持っている可能性があることを明らかにしています。このデータは微調整にも利用できるため、この観察結果から、事前トレーニングデータを微調整に活用するようになりました。事前トレーニングデータを使用した一般化の結果は、適切な事前トレーニングデータを微調整に含めると、ターゲットタスクの最終的なパフォーマンスを向上できることを示しています。理論的発見の洞察をもとに、事前トレーニングデータからサブセットを選択してターゲットタスクの一般化を改善するための新しい選択戦略を提案します。 8つのベンチマークデータセットでの画像分類タスクの広範な実験結果は、提案されたデータ選択ベースの微調整パイプラインの有効性を検証します。
As a dominant paradigm, fine-tuning a pre-trained model on the target data is widely used in many deep learning applications, especially for small data sets. However, recent studies have empirically shown that training from scratch has the final performance that is no worse than this pre-training strategy once the number of training iterations is increased in some vision tasks. In this work, we revisit this phenomenon from the perspective of generalization analysis which is popular in learning theory. Our result reveals that the final prediction precision may have a weak dependency on the pre-trained model especially in the case of large training iterations. The observation inspires us to leverage pre-training data for fine-tuning, since this data is also available for fine-tuning. The generalization result of using pre-training data shows that the final performance on a target task can be improved when the appropriate pre-training data is included in fine-tuning. With the insight of the theoretical finding, we propose a novel selection strategy to select a subset from pre-training data to help improve the generalization on the target task. Extensive experimental results for image classification tasks on 8 benchmark data sets verify the effectiveness of the proposed data selection based fine-tuning pipeline.
updated: Wed Nov 24 2021 06:18:32 GMT+0000 (UTC)
published: Wed Nov 24 2021 06:18:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト