Enforcing Linearity in DNN succours Robustness and Adversarial Image Generation
  ニューラルネットワークの敵対的脆弱性に関する最近の研究により、考えられるすべての敵対的摂動に対するワーストケース損失の上限を最小化する目的でトレーニングされたモデルが敵対的攻撃に対する堅牢性を改善することが示されました。敵対者のトレーニングフレームワークを活用することに加えて、変換された入力および特徴空間で線形になるようにディープニューラルネットワーク(DNN)を強制することにより、堅牢性が大幅に向上することを示します。また、Local Lipschitz regularizerで目的関数を増強することにより、モデルの堅牢性がさらに向上することも示します。私たちの方法は、最も洗練された敵の訓練方法よりも優れており、MNIST、CIFAR10およびSVHNデータセットで最先端の敵の精度を達成します。本論文では、敵対的に訓練された深層ニューラルネットワーク分類器の逆表現学習と線形性の側面を活用することにより、新しい敵対画像生成方法も提案する。
Recent studies on the adversarial vulnerability of neural networks have shown that models trained with the objective of minimizing an upper bound on the worst-case loss over all possible adversarial perturbations improve robustness against adversarial attacks. Beside exploiting adversarial training framework, we show that by enforcing a Deep Neural Network (DNN) to be linear in transformed input and feature space improves robustness significantly. We also demonstrate that by augmenting the objective function with Local Lipschitz regularizer boost robustness of the model further. Our method outperforms most sophisticated adversarial training methods and achieves state of the art adversarial accuracy on MNIST, CIFAR10 and SVHN dataset. In this paper, we also propose a novel adversarial image generation method by leveraging Inverse Representation Learning and Linearity aspect of an adversarially trained deep neural network classifier.
updated: Mon Oct 21 2019 17:00:50 GMT+0000 (UTC)
published: Thu Oct 17 2019 18:38:40 GMT+0000 (UTC)
