arXiv reaDer
バッチノーマライゼーションを削除すると、敵対的なトレーニングが促進されます
Removing Batch Normalization Boosts Adversarial Training
敵対的トレーニング(AT)は、敵対的攻撃から深いニューラルネットワークを防御します。その実用的なアプリケーションを制限する1つの課題は、クリーンなサンプルのパフォーマンスの低下です。以前の作業で特定された主なボトルネックは、広く使用されているバッチ正規化(BN)です。これは、ATのクリーンなトレーニングサンプルと敵対的なトレーニングサンプルのさまざまな統計をモデル化するのに苦労しています。主なアプローチは、この分布の混合をキャプチャするためにBNを拡張することですが、ATのすべてのBN層を削除することにより、このボトルネックを完全に排除することを提案します。ノーマライザーフリーのロバストトレーニング(NoFrost)メソッドは、ノーマライザーフリーネットワークの最近の進歩をATに拡張し、混合分布の課題を処理する上での未踏の利点を提供します。 NoFrostは、クリーンなサンプルの精度をわずかに犠牲にするだけで、敵対的な堅牢性を実現することを示しています。 ResNet50を使用したImageNetでは、NoFrostは74.06%のクリーンな精度を達成します。これは、標準のトレーニングからわずか2.00%低下します。対照的に、BNベースのATは59.28%のクリーン精度を実現し、標準トレーニングから大幅に16.78%低下します。さらに、NoFrostはPGD攻撃に対して23.56%の敵対的堅牢性を実現し、BNベースのATで13.57%の堅牢性を向上させます。 NoFrostにより、モデルの滑らかさが向上し、決定マージンが大きくなります。これにより、モデルは入力の摂動に対する感度が低くなり、より堅牢になります。さらに、より多くのデータ拡張をNoFrostに組み込むと、複数の分散シフトに対する包括的な堅牢性が実現されます。コードと事前トレーニング済みモデルは、https://github.com/amazon-research/normalizer-free-robust-trainingで公開されています。
Adversarial training (AT) defends deep neural networks against adversarial attacks. One challenge that limits its practical application is the performance degradation on clean samples. A major bottleneck identified by previous works is the widely used batch normalization (BN), which struggles to model the different statistics of clean and adversarial training samples in AT. Although the dominant approach is to extend BN to capture this mixture of distribution, we propose to completely eliminate this bottleneck by removing all BN layers in AT. Our normalizer-free robust training (NoFrost) method extends recent advances in normalizer-free networks to AT for its unexplored advantage on handling the mixture distribution challenge. We show that NoFrost achieves adversarial robustness with only a minor sacrifice on clean sample accuracy. On ImageNet with ResNet50, NoFrost achieves 74.06% clean accuracy, which drops merely 2.00% from standard training. In contrast, BN-based AT obtains 59.28% clean accuracy, suffering a significant 16.78% drop from standard training. In addition, NoFrost achieves a 23.56% adversarial robustness against PGD attack, which improves the 13.57% robustness in BN-based AT. We observe better model smoothness and larger decision margins from NoFrost, which make the models less sensitive to input perturbations and thus more robust. Moreover, when incorporating more data augmentations into NoFrost, it achieves comprehensive robustness against multiple distribution shifts. Code and pre-trained models are public at https://github.com/amazon-research/normalizer-free-robust-training.
updated: Mon Jul 04 2022 01:39:37 GMT+0000 (UTC)
published: Mon Jul 04 2022 01:39:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト