Adaptive Generation of Unrestricted Adversarial Inputs
  ニューラルネットワークは、敵対的に構築された入力の摂動に対して脆弱です。これまでのほとんどの研究では、何らかの$ l_p $ノルムの下で固定された大きさの摂動が考慮されてきました。これらの攻撃を研究することは価値がありますが、無制限の攻撃の構築(および堅牢性)への関心が高まっています。このような無制限の敵入力を生成するための新しいアルゴリズムを導入します。これは、以前の研究とは異なり、適応性があります。攻撃対象を分類子に合わせて調整できます。また、既存の最新技術よりも400〜2,000倍高速化されます。摂動ベースの攻撃に対してロバストな分類器をだます無制限の敵対的入力を生成することにより、アプローチを示します。また、適応性があり無制限であることにより、攻撃が攻撃に対する敵の訓練に打ち勝つことができることも示しています。
Neural networks are vulnerable to adversarially-constructed perturbations of their inputs. Most research so far has considered perturbations of a fixed magnitude under some $l_p$ norm. Although studying these attacks is valuable, there has been increasing interest in the construction of (and robustness to) unrestricted attacks, which are not constrained to a small and rather artificial subset of all possible adversarial inputs. We introduce a novel algorithm for generating such unrestricted adversarial inputs which, unlike prior work, is adaptive: it is able to tune its attacks to the classifier being targeted. It also offers a 400-2,000x speedup over the existing state of the art. We demonstrate our approach by generating unrestricted adversarial inputs that fool classifiers robust to perturbation-based attacks. We also show that, by virtue of being adaptive and unrestricted, our attack is able to defeat adversarial training against it.
updated: Tue Oct 01 2019 12:43:55 GMT+0000 (UTC)
published: Tue May 07 2019 10:54:43 GMT+0000 (UTC)
