ニューラルネットワークの敵対的ロバスト性は、主に2つの要因に依存します。1つはネットワークの特徴表現能力であり、もう1つは摂動に対する抵抗能力です。本論文では、畳み込み層の特徴マップからネットワークの摂動防止能力を研究した。私たちの理論的分析は、平均的なプーリングの前のより大きな畳み込み特徴が摂動に対するより良い抵抗に寄与することができることを発見しますが、結論は最大のプーリングには当てはまりません。理論的発見に基づいて、既存のニューラルネットワークの堅牢性を向上させるための2つの実行可能な方法を提示します。提案されたアプローチは非常に単純であり、入力をアップサンプリングするか、畳み込み演算子のストライド構成を変更するだけで済みます。 AlexNet、VGG16、RestNet18、PreActResNet18など、いくつかのベンチマークニューラルネットワークアーキテクチャでアプローチをテストし、さまざまな攻撃の下で自然な精度と堅牢性の両方を大幅に改善します。私たちの研究は、堅牢なニューラルネットワークの設計に新しい洞察をもたらします。コードはhttps://github.com/MTandHJ/rcmで入手できます。
The adversarial robustness of a neural network mainly relies on two factors, one is the feature representation capacity of the network, and the other is its resistance ability to perturbations. In this paper, we study the anti-perturbation ability of the network from the feature maps of convolutional layers. Our theoretical analysis discovers that larger convolutional features before average pooling can contribute to better resistance to perturbations, but the conclusion is not true for max pooling. Based on the theoretical findings, we present two feasible ways to improve the robustness of existing neural networks. The proposed approaches are very simple and only require upsampling the inputs or modifying the stride configuration of convolution operators. We test our approaches on several benchmark neural network architectures, including AlexNet, VGG16, RestNet18 and PreActResNet18, and achieve non-trivial improvements on both natural accuracy and robustness under various attacks. Our study brings new insights into the design of robust neural networks. The code is available at https://github.com/MTandHJ/rcm.