Structure Matters: Towards Generating Transferable Adversarial Images
 画像分類の敵対的な例に関する最近の研究は、わずかな摂動でピクセルを直接修正することに焦点を当てています。生成された敵対者の例が人間にとって自然で現実的であることを保証するために小さな摂動要件が課されますが、これにより攻撃スペースが制限され、特に防御メカニズムで保護されたシステムの攻撃能力と転送可能性が制限されます。この論文では、画像を自然に保ちながら、小さな摂動の制約を緩和する構造パターンと構造を意識した摂動の新しい概念を提案します。私たちのアプローチの鍵となる考え方は、人間の分類器の中心となる構造パターンを維持しながら、敵対的な例の知覚可能な逸脱を許可することです。これらの概念に基づいて、非常に高い転送可能性を備えた自然な敵対的な例を生成するための構造保存攻撃(SPA)を提案します。 MNISTおよびCIFAR10データセットの実証結果は、防御が適用されていても、SPAがホワイトボックスとブラックボックスの両方の設定で強力な攻撃能力を発揮することを示しています。さらに、PGDまたはCW攻撃の統合により、その攻撃能力は、SPAから継承された顕著な転送可能性を失うことなく、ホワイトボックス設定で急激にエスカレートします。
Recent works on adversarial examples for image classification focus on directly modifying pixels with minor perturbations. The small perturbation requirement is imposed to ensure the generated adversarial examples being natural and realistic to humans, which, however, puts a curb on the attack space thus limiting the attack ability and transferability especially for systems protected by a defense mechanism. In this paper, we propose the novel concepts of structure patterns and structure-aware perturbations that relax the small perturbation constraint while still keeping images natural. The key idea of our approach is to allow perceptible deviation in adversarial examples while keeping structure patterns that are central to a human classifier. Built upon these concepts, we propose a structure-preserving attack (SPA) for generating natural adversarial examples with extremely high transferability. Empirical results on the MNIST and the CIFAR10 datasets show that SPA exhibits strong attack ability in both the white-box and black-box setting even defenses are applied. Moreover, with the integration of PGD or CW attack, its attack ability escalates sharply under the white-box setting, without losing the outstanding transferability inherited from SPA.
updated: Fri Aug 14 2020 10:33:59 GMT+0000 (UTC)
published: Tue Oct 22 2019 08:20:00 GMT+0000 (UTC)
