arXiv reaDer
マスクされた画像モデリングにおけるデータスケーリングについて
On Data Scaling in Masked Image Modeling
自己監視学習の重要な目標は、モデルの事前トレーニングがほぼ無制限のデータから利益を得ることができるようにすることです。ただし、最近普及している1つの方法、つまりマスク画像モデリング(MIM)は、より大きなデータの恩恵を受けることができないと考えられています。この作業では、ImageNet-1Kの10%から完全なImageNet-22Kの範囲のデータスケール、4,900万から10億の範囲のモデルサイズ、および125Kの反復から500Kの反復の範囲のトレーニング長で、広範な実験を通じてこの誤解を打ち破ります。私たちの調査では、次のことが明らかになっています。(i)マスクされた画像モデリングもより大きなデータを要求します。非常に大きなモデルでは、比較的小さなデータが過剰に適合していることがわかりました。 (ii)トレーニングの長さが重要です。マスクされた画像モデリングでトレーニングされた大規模なモデルは、より長いトレーニングでより多くのデータから利益を得ることができます。 (iii)事前トレーニングでの検証損失は、複数のタスクの微調整に対してモデルがどの程度適切に機能するかを測定するための優れた指標です。この観察により、下流のタスクのコストのかかる試行錯誤の評価を行うことなく、事前にトレーニングされたモデルを事前に評価することができます。私たちの発見が、スケーリング能力の観点からマスクされた画像モデリングの理解を深めることを願っています。
An important goal of self-supervised learning is to enable model pre-training to benefit from almost unlimited data. However, one method that has recently become popular, namely masked image modeling (MIM), is suspected to be unable to benefit from larger data. In this work, we break this misconception through extensive experiments, with data scales ranging from 10% of ImageNet-1K to full ImageNet-22K, model sizes ranging from 49 million to 1 billion, and training lengths ranging from 125K iterations to 500K iterations. Our study reveals that: (i) Masked image modeling is also demanding on larger data. We observed that very large models got over-fitted with relatively small data; (ii) The length of training matters. Large models trained with masked image modeling can benefit from more data with longer training; (iii) The validation loss in pre-training is a good indicator to measure how well the model performs for fine-tuning on multiple tasks. This observation allows us to pre-evaluate pre-trained models in advance without having to make costly trial-and-error assessments of downstream tasks. We hope that our findings will advance the understanding of masked image modeling in terms of scaling ability.
updated: Thu Jun 09 2022 17:58:24 GMT+0000 (UTC)
published: Thu Jun 09 2022 17:58:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト