arXiv reaDer
空間勾配スケーリングによる再パラメータ化
Reparameterization through Spatial Gradient Scaling
再パラメータ化は、トレーニング中に畳み込み層を同等の多分岐構造に変換することにより、ディープ ニューラル ネットワークの一般化を改善することを目的としています。ただし、再パラメータ化がどのように変化し、ニューラル ネットワークの学習プロセスに利益をもたらすかを理解するには、ギャップが存在します。この論文では、畳み込みネットワークの重み間で学習の焦点を再分配するための新しい空間勾配スケーリング方法を提示します。空間勾配スケーリングが、ネットワークに構造的な変化を導入することなく、分岐した再パラメータ化と同じ学習ダイナミクスを達成することを証明します。さらに、相互情報量によって測定された入力特徴マップの空間特性に基づいて、各畳み込み層のスケーリングを動的に学習する分析アプローチを提案します。 CIFAR-10、CIFAR-100、および ImageNet での実験は、再パラメーター化された構造を検索することなく、提案されたスケーリング方法が最先端の再パラメーター化戦略よりも低い計算コストで優れていることを示しています。
Reparameterization aims to improve the generalization of deep neural networks by transforming convolutional layers into equivalent multi-branched structures during training. However, there exists a gap in understanding how reparameterization may change and benefit the learning process of neural networks. In this paper, we present a novel spatial gradient scaling method to redistribute learning focus among weights in convolutional networks. We prove that spatial gradient scaling achieves the same learning dynamics as a branched reparameterization yet without introducing structural changes into the network. We further propose an analytical approach that dynamically learns scalings for each convolutional layer based on the spatial characteristics of its input feature map gauged by mutual information. Experiments on CIFAR-10, CIFAR-100, and ImageNet show that without searching for reparameterized structures, our proposed scaling method outperforms the state-of-the-art reparameterization strategies at a lower computational cost.
updated: Sun Mar 05 2023 17:57:33 GMT+0000 (UTC)
published: Sun Mar 05 2023 17:57:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト