One pixel attack for fooling deep neural networks
  最近の研究により、Deep Neural Networks(DNN)の出力は、入力ベクトルに比較的小さな摂動を加えることで簡単に変更できることが明らかになりました。このホワイトペーパーでは、1つのピクセルのみを変更できる非常に限られたシナリオで攻撃を分析します。そのために、微分進化(DE)に基づいて1ピクセルの敵対摂動を生成する新しい方法を提案します。それはより少ない敵対的情報(ブラックボックス攻撃)を必要とし、DEの固有の機能のためにより多くのタイプのネットワークをだますことができます。結果は、Kaggle CIFAR-10テストデータセットの自然画像の67.97%およびImageNet(ILSVRC 2012)テスト画像の16.04%が、74.03%および22.91%の信頼度で1つのピクセルのみを変更することにより、少なくとも1つのターゲットクラスに乱れていることを示しています平均して。元のCIFAR-10データセットにも同じ脆弱性があります。したがって、提案された攻撃では、極端な限られたシナリオでの敵対的な機械学習の異なる考え方を探り、現在のDNNもこのような低次元攻撃に対して脆弱であることを示しています。さらに、敵対機械学習の領域でのDE(または大まかに言えば、進化的計算)の重要なアプリケーションも示します:堅牢性を評価するためのニューラルネットワークに対する低コストの敵対攻撃を効果的に生成できるツールを作成します。
Recent research has revealed that the output of Deep Neural Networks (DNN) can be easily altered by adding relatively small perturbations to the input vector. In this paper, we analyze an attack in an extremely limited scenario where only one pixel can be modified. For that we propose a novel method for generating one-pixel adversarial perturbations based on differential evolution (DE). It requires less adversarial information (a black-box attack) and can fool more types of networks due to the inherent features of DE. The results show that 67.97% of the natural images in Kaggle CIFAR-10 test dataset and 16.04% of the ImageNet (ILSVRC 2012) test images can be perturbed to at least one target class by modifying just one pixel with 74.03% and 22.91% confidence on average. We also show the same vulnerability on the original CIFAR-10 dataset. Thus, the proposed attack explores a different take on adversarial machine learning in an extreme limited scenario, showing that current DNNs are also vulnerable to such low dimension attacks. Besides, we also illustrate an important application of DE (or broadly speaking, evolutionary computation) in the domain of adversarial machine learning: creating tools that can effectively generate low-cost adversarial attacks against neural networks for evaluating robustness.
updated: Thu Oct 17 2019 07:46:53 GMT+0000 (UTC)
published: Tue Oct 24 2017 16:02:19 GMT+0000 (UTC)
