arXiv reaDer
畳み込み正規化:深い畳み込みネットワークのロバスト性とトレーニングの改善
Convolutional Normalization: Improving Deep Convolutional Network Robustness and Training
正規化手法は、最新の畳み込みニューラルネットワーク(ConvNets)の基本コンポーネントになっています。特に、最近の多くの研究は、重みの直交性を促進することが、深いモデルのトレーニングとロバスト性の向上に役立つことを示しています。 ConvNetの場合、ほとんどの既存の方法は、畳み込みカーネルの連結または平坦化から導出された重み行列のペナルティまたは正規化に基づいています。これらのメソッドは、カーネルの良性の畳み込み構造を破壊または無視することがよくあります。したがって、それらは多くの場合、深いConvNetには高価または非現実的です。対照的に、フーリエ領域の畳み込み構造を十分に活用し、任意のConvNetに便利に組み込むことができる単純なプラグアンドプレイモジュールとして機能する、シンプルで効率的な「畳み込み正規化」(ConvNorm)メソッドを紹介します。私たちの方法は、畳み込みスパースコーディングの前処理法に関する最近の研究に触発されており、各層のチャネルごとの等長写像を効果的に促進できます。さらに、ConvNormが重み行列の層ごとのスペクトルノルムを減らし、ネットワークのリプシッツネスを改善し、深いConvNetのトレーニングを容易にし、ロバスト性を改善できることを示します。ノイズ破損と生成的敵対的ネットワーク(GAN)の下での分類に適用すると、ConvNormがResNetなどの一般的なConvNetの堅牢性とGANのパフォーマンスを向上させることを示します。 CIFARとImageNetでの数値実験により、調査結果を検証します。
Normalization techniques have become a basic component in modern convolutional neural networks (ConvNets). In particular, many recent works demonstrate that promoting the orthogonality of the weights helps train deep models and improve robustness. For ConvNets, most existing methods are based on penalizing or normalizing weight matrices derived from concatenating or flattening the convolutional kernels. These methods often destroy or ignore the benign convolutional structure of the kernels; therefore, they are often expensive or impractical for deep ConvNets. In contrast, we introduce a simple and efficient "Convolutional Normalization" (ConvNorm) method that can fully exploit the convolutional structure in the Fourier domain and serve as a simple plug-and-play module to be conveniently incorporated into any ConvNets. Our method is inspired by recent work on preconditioning methods for convolutional sparse coding and can effectively promote each layer's channel-wise isometry. Furthermore, we show that our ConvNorm can reduce the layerwise spectral norm of the weight matrices and hence improve the Lipschitzness of the network, leading to easier training and improved robustness for deep ConvNets. Applied to classification under noise corruptions and generative adversarial network (GAN), we show that the ConvNorm improves the robustness of common ConvNets such as ResNet and the performance of GAN. We verify our findings via numerical experiments on CIFAR and ImageNet.
updated: Tue Jan 04 2022 01:05:09 GMT+0000 (UTC)
published: Mon Mar 01 2021 00:33:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト