arXiv reaDer
正規化されていないResNetのパフォーマンスギャップを埋めるための信号伝搬の特性評価
Characterizing signal propagation to close the performance gap in unnormalized ResNets
バッチ正規化は、ほとんどすべての最先端の画像分類器の重要なコンポーネントですが、実用的な課題ももたらします。バッチ内のトレーニング例間の独立性が失われ、計算とメモリのオーバーヘッドが発生し、予期しないバグが発生することがよくあります。 。初期化時のディープResNetの最近の理論的分析に基づいて、フォワードパスでの信号伝搬を特徴付ける単純な分析ツールのセットを提案し、これらのツールを活用して、アクティブ化正規化レイヤーなしで高性能のResNetを設計します。私たちの成功にとって重要なのは、最近提案された重量標準化の適応バージョンです。私たちの分析ツールは、チャネルごとの活性化手段が深さとともに成長しないようにすることで、この手法がReLUまたはSwish活性化関数を備えたネットワークで信号をどのように保存するかを示しています。さまざまなFLOP予算全体で、当社のネットワークは、ImageNet上の最先端のEfficientNetと競争力のあるパフォーマンスを実現しています。
Batch Normalization is a key component in almost all state-of-the-art image classifiers, but it also introduces practical challenges: it breaks the independence between training examples within a batch, can incur compute and memory overhead, and often results in unexpected bugs. Building on recent theoretical analyses of deep ResNets at initialization, we propose a simple set of analysis tools to characterize signal propagation on the forward pass, and leverage these tools to design highly performant ResNets without activation normalization layers. Crucial to our success is an adapted version of the recently proposed Weight Standardization. Our analysis tools show how this technique preserves the signal in networks with ReLU or Swish activation functions by ensuring that the per-channel activation means do not grow with depth. Across a range of FLOP budgets, our networks attain performance competitive with the state-of-the-art EfficientNets on ImageNet.
updated: Thu Jan 21 2021 16:07:06 GMT+0000 (UTC)
published: Thu Jan 21 2021 16:07:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト