arXiv reaDer
中間レベルの摂動減衰による敵対的伝達性の改善
Improving Adversarial Transferability by Intermediate-level Perturbation Decay
敵対的な方向に従ってフィーチャ表現を劇的に混乱させようとする中間レベルの攻撃は、転送可能な敵対的な例を作成する際に良好なパフォーマンスを示しています。このカテゴリの既存の方法は、通常、最初に方向ガイドを決定する必要があり、その後方向ガイドへの中間レベルの摂動のスカラー射影が拡大される 2 つの別々の段階で定式化されます。得られた摂動は、特徴空間で必然的にガイドから逸脱し、この論文では、そのような逸脱が次善の攻撃につながる可能性があることが明らかになりました。この問題に対処するために、最適化の単一段階内で敵対的な例を作成する新しい中間レベルの方法を開発します。特に、中間レベルの摂動減衰(ILPD)と名付けられた提案された方法は、中間レベルの摂動が効果的な敵対的な方向になり、同時に大きな大きさを持つようにします。詳細な議論は、私たちの方法の有効性を検証します。実験結果によると、ImageNet (平均 +10.07%) および CIFAR-10 (平均 +3.88%) のさまざまな被害者モデルへの攻撃において、最新技術よりも大幅に優れていることが示されています。コードは https://github.com/qizhangli/ILPD-attack にあります。
Intermediate-level attacks that attempt to perturb feature representations following an adversarial direction drastically have shown favorable performance in crafting transferable adversarial examples. Existing methods in this category are normally formulated with two separate stages, where a directional guide is required to be determined at first and the scalar projection of the intermediate-level perturbation onto the directional guide is enlarged thereafter. The obtained perturbation deviates from the guide inevitably in the feature space, and it is revealed in this paper that such a deviation may lead to sub-optimal attack. To address this issue, we develop a novel intermediate-level method that crafts adversarial examples within a single stage of optimization. In particular, the proposed method, named intermediate-level perturbation decay (ILPD), encourages the intermediate-level perturbation to be in an effective adversarial direction and to possess a great magnitude simultaneously. In-depth discussion verifies the effectiveness of our method. Experimental results show that it outperforms state-of-the-arts by large margins in attacking various victim models on ImageNet (+10.07% on average) and CIFAR-10 (+3.88% on average). Our code is at https://github.com/qizhangli/ILPD-attack.
updated: Wed Apr 26 2023 09:49:55 GMT+0000 (UTC)
published: Wed Apr 26 2023 09:49:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト