arXiv reaDer
深い残差学習のためのShakeDrop正則化
ShakeDrop Regularization for Deep Residual Learning
 オーバーフィッティングは、最新のネットワークアーキテクチャであっても、ディープニューラルネットワークの重要な問題です。このホワイトペーパーでは、ResNetとその改善(Wide ResNet、PyramidNet、およびResNeXt)の過剰適合効果を軽減するために、ShakeDrop正則化と呼ばれる新しい正則化方法を提案します。 ShakeDropはShake-Shakeに触発されたもので、効果的な正則化方法ですが、ResNeXtにのみ適用できます。 ShakeDropはShake-Shakeよりも効果的で、ResNeXtだけでなく、ResNet、Wide ResNet、およびPyramidNetにも適用できます。重要な鍵は、トレーニングの安定性を達成することです。効果的な正則化は不安定なトレーニングを引き起こすことが多いため、既存の正則化器の珍しい使用法であるトレーニングスタビライザーを導入します。さまざまな条件下での実験を通じて、ShakeDropがうまく機能する条件を示します。
Overfitting is a crucial problem in deep neural networks, even in the latest network architectures. In this paper, to relieve the overfitting effect of ResNet and its improvements (i.e., Wide ResNet, PyramidNet, and ResNeXt), we propose a new regularization method called ShakeDrop regularization. ShakeDrop is inspired by Shake-Shake, which is an effective regularization method, but can be applied to ResNeXt only. ShakeDrop is more effective than Shake-Shake and can be applied not only to ResNeXt but also ResNet, Wide ResNet, and PyramidNet. An important key is to achieve stability of training. Because effective regularization often causes unstable training, we introduce a training stabilizer, which is an unusual use of an existing regularizer. Through experiments under various conditions, we demonstrate the conditions under which ShakeDrop works well.
updated: Mon Jan 06 2020 07:14:51 GMT+0000 (UTC)
published: Wed Feb 07 2018 10:23:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト