arXiv reaDer
MimicNorm:重み平均と最後のBNレイヤーはバッチ正規化のダイナミクスを模倣します
MimicNorm: Weight Mean and Last BN Layer Mimic the Dynamic of Batch Normalization
実質的な実験により、収束と一般化に役立つバッチ正規化(BN)レイヤーの成功が検証されました。ただし、BNには追加のメモリと浮動小数点計算が必要です。さらに、BNはバッチ統計に依存するため、マイクロバッチでは不正確になります。このホワイトペーパーでは、BN層の2つの基本的な影響、つまりデータの無相関化と適応学習率を維持しながら、BNの正則化を単純化することでこれらの問題に対処します。ネットワークトレーニングの収束と効率を改善するために、MimicNormという名前の新しい正規化方法を提案します。 MimicNormは、修正された重み平均操作(重みパラメーターテンソルから平均値を減算)と損失関数の前の1つのBN層(最後のBN層)を含む2つの軽い操作のみで構成されます。ニューラルタンジェントカーネル(NTK)理論を活用して、重み平均演算がアクティブ化を白くし、ネットワークをBN層のようなカオス領域に移行させ、その結果、収束を強化することを証明します。最後のBNレイヤーは、自動調整された学習率を提供し、精度も向上させます。実験結果によると、MimicNormは、ResNetやShuffleNetなどの軽量ネットワークを含むさまざまなネットワーク構造で同様の精度を達成し、メモリ消費量を約20%削減します。コードはhttps://github.com/Kid-key/MimicNormで公開されています。
Substantial experiments have validated the success of Batch Normalization (BN) Layer in benefiting convergence and generalization. However, BN requires extra memory and float-point calculation. Moreover, BN would be inaccurate on micro-batch, as it depends on batch statistics. In this paper, we address these problems by simplifying BN regularization while keeping two fundamental impacts of BN layers, i.e., data decorrelation and adaptive learning rate. We propose a novel normalization method, named MimicNorm, to improve the convergence and efficiency in network training. MimicNorm consists of only two light operations, including modified weight mean operations (subtract mean values from weight parameter tensor) and one BN layer before loss function (last BN layer). We leverage the neural tangent kernel (NTK) theory to prove that our weight mean operation whitens activations and transits network into the chaotic regime like BN layer, and consequently, leads to an enhanced convergence. The last BN layer provides autotuned learning rates and also improves accuracy. Experimental results show that MimicNorm achieves similar accuracy for various network structures, including ResNets and lightweight networks like ShuffleNet, with a reduction of about 20% memory consumption. The code is publicly available at https://github.com/Kid-key/MimicNorm.
updated: Wed Sep 27 2023 11:38:52 GMT+0000 (UTC)
published: Mon Oct 19 2020 07:42:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト