arXiv reaDer
再初期化はいつ機能しますか?
When Does Re-initialization Work?
トレーニング中にニューラルネットワークを再初期化すると、最近の作業で一般化が改善されることが観察されています。それでも、ディープラーニングの実践では広く採用されておらず、最先端のトレーニングプロトコルでも頻繁に使用されていません。これにより、再初期化がいつ機能するか、データ拡張、重みの減衰、学習率のスケジュールなどの正則化手法と一緒に使用する必要があるかどうかという疑問が生じます。この作業では、この質問に答えるために、標準トレーニングと再初期化方法の選択との広範な経験的比較を行い、さまざまな画像分類ベンチマークで15,000を超えるモデルをトレーニングします。最初に、そのような方法が、他の正則化がない場合の一般化に一貫して有益であることを確立します。ただし、他の注意深く調整された正則化手法と一緒に展開すると、再初期化方法は一般化にほとんどまたはまったく追加の利点を提供しませんが、最適な一般化パフォーマンスは学習率と重み減衰ハイパーパラメーターの選択にあまり敏感ではなくなります。再初期化方法がノイズの多いデータに与える影響を調査するために、ラベルノイズの下での学習も検討します。驚くべきことに、この場合、他の注意深く調整された正則化手法が存在する場合でも、再初期化は標準トレーニングを大幅に改善します。
Re-initializing a neural network during training has been observed to improve generalization in recent works. Yet it is neither widely adopted in deep learning practice nor is it often used in state-of-the-art training protocols. This raises the question of when re-initialization works, and whether it should be used together with regularization techniques such as data augmentation, weight decay and learning rate schedules. In this work, we conduct an extensive empirical comparison of standard training with a selection of re-initialization methods to answer this question, training over 15,000 models on a variety of image classification benchmarks. We first establish that such methods are consistently beneficial for generalization in the absence of any other regularization. However, when deployed alongside other carefully tuned regularization techniques, re-initialization methods offer little to no added benefit for generalization, although optimal generalization performance becomes less sensitive to the choice of learning rate and weight decay hyperparameters. To investigate the impact of re-initialization methods on noisy data, we also consider learning under label noise. Surprisingly, in this case, re-initialization significantly improves upon standard training, even in the presence of other carefully tuned regularization techniques.
updated: Mon Jun 20 2022 21:23:15 GMT+0000 (UTC)
published: Mon Jun 20 2022 21:23:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト