このホワイトペーパーでは、特に防御モデル(防御敵対攻撃のモデル)に対する、移転可能な敵対例の学習に焦点を当てています。特に、単純な普遍的摂動が一連の最先端の防御をだますことができることを示します。既存の攻撃によって生成された敵対的な例は、通常、防御モデルに転送することが困難です。敵対的な摂動における地域的な均一性の特性を観察し、防御が地域的に均一な摂動に対してロバスト性が低いことを示唆します。したがって、既存の摂動を地域的に均一なものに変換するための効果的な変換パラダイムとカスタマイズされた勾配変換モジュールを提案します。摂動を普遍的にすることを明示的に強制せずに、よく訓練された勾配変換モジュールは、入力に依存しない勾配(したがって、普遍的)を出力する傾向があり、アンダーフィッティング現象の恩恵を受けることがわかります。徹底的な実験は、転送ベースの攻撃設定で9つの防御を攻撃すると、私たちの作業が従来の攻撃アルゴリズム(画像依存またはユニバーサルのアルゴリズム)よりも平均14.0%向上することを示しています。モデル間の転送可能性に加えて、地域的に均一な摂動がさまざまなビジョンタスク(意味的セグメンテーションタスクでの攻撃とオブジェクト検出タスクでのテスト)間でうまく転送できることも確認します。コードは、https://github.com/LiYingwei/Regional-Homogeneityから入手できます。
This paper focuses on learning transferable adversarial examples specifically against defense models (models to defense adversarial attacks). In particular, we show that a simple universal perturbation can fool a series of state-of-the-art defenses. Adversarial examples generated by existing attacks are generally hard to transfer to defense models. We observe the property of regional homogeneity in adversarial perturbations and suggest that the defenses are less robust to regionally homogeneous perturbations. Therefore, we propose an effective transforming paradigm and a customized gradient transformer module to transform existing perturbations into regionally homogeneous ones. Without explicitly forcing the perturbations to be universal, we observe that a well-trained gradient transformer module tends to output input-independent gradients (hence universal) benefiting from the under-fitting phenomenon. Thorough experiments demonstrate that our work significantly outperforms the prior art attacking algorithms (either image-dependent or universal ones) by an average improvement of 14.0% when attacking 9 defenses in the transfer-based attack setting. In addition to the cross-model transferability, we also verify that regionally homogeneous perturbations can well transfer across different vision tasks (attacking with the semantic segmentation task and testing on the object detection task). The code is available here: https://github.com/LiYingwei/Regional-Homogeneity.