arXiv reaDer
クロスイテレーションバッチ正規化
Cross-Iteration Batch Normalization
バッチ正規化のよく知られた問題は、ミニバッチサイズが小さい場合に効果が大幅に低下することです。ミニバッチにいくつかの例が含まれている場合、正規化が定義されている統計は、トレーニングの反復中にそれから確実に推定することはできません。この問題に対処するために、クロスイテレーションバッチ正規化(CBN)を紹介します。この場合、最近の複数のイテレーションの例を共同で使用して、推定品質を向上させます。複数の反復にわたる統計を計算する際の課題は、ネットワークの重みが変化するため、異なる反復からのネットワークのアクティブ化が互いに比較できないことです。したがって、テイラー多項式に基づく提案手法を介してネットワークの重みの変化を補正し、統計を正確に推定して、バッチ正規化を効果的に適用できるようにします。小さなミニバッチサイズでのオブジェクト検出と画像分類では、CBNは、提案された補正手法を使用せずに、元のバッチ正規化と以前の反復に対する統計の直接計算よりも優れていることがわかります。コードはhttps://github.com/Howal/Cross-iterationBatchNormで入手できます。
A well-known issue of Batch Normalization is its significantly reduced effectiveness in the case of small mini-batch sizes. When a mini-batch contains few examples, the statistics upon which the normalization is defined cannot be reliably estimated from it during a training iteration. To address this problem, we present Cross-Iteration Batch Normalization (CBN), in which examples from multiple recent iterations are jointly utilized to enhance estimation quality. A challenge of computing statistics over multiple iterations is that the network activations from different iterations are not comparable to each other due to changes in network weights. We thus compensate for the network weight changes via a proposed technique based on Taylor polynomials, so that the statistics can be accurately estimated and batch normalization can be effectively applied. On object detection and image classification with small mini-batch sizes, CBN is found to outperform the original batch normalization and a direct calculation of statistics over previous iterations without the proposed compensation technique. Code is available at https://github.com/Howal/Cross-iterationBatchNorm .
updated: Thu Mar 25 2021 06:57:36 GMT+0000 (UTC)
published: Thu Feb 13 2020 18:52:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト