arXiv reaDer
敵対的防御を評価および強化するためのガイド付き敵対的攻撃
Guided Adversarial Attack for Evaluating and Enhancing Adversarial Defenses
敵対的攻撃の開発の進歩は、敵対的防衛研究の進歩の基本でした。効率的で効果的な攻撃は、防御を確実に評価し、堅牢なモデルを開発するために不可欠です。敵対的攻撃は、多くの場合、Projected Gradient Descent(PGD)を使用して設定された制約内で、クロスエントロピー損失や最大マージン損失などの標準損失を最大化することによって生成されます。この作業では、標準損失に緩和項を導入します。これにより、より適切な勾配方向が見つかり、攻撃の有効性が高まり、より効率的な敵対者のトレーニングにつながります。クリーンな画像の関数マッピングを利用して敵の生成を誘導し、より強力な攻撃をもたらすガイド付き敵対マージン攻撃(GAMA)を提案します。複数の防御に対する攻撃を評価し、既存の攻撃と比較してパフォーマンスが向上していることを示しています。さらに、攻撃の生成とトレーニングの両方に提案された緩和項を利用することにより、シングルステップ防御の中で最先端のパフォーマンスを実現するガイド付き敵対トレーニング(GAT)を提案します。
Advances in the development of adversarial attacks have been fundamental to the progress of adversarial defense research. Efficient and effective attacks are crucial for reliable evaluation of defenses, and also for developing robust models. Adversarial attacks are often generated by maximizing standard losses such as the cross-entropy loss or maximum-margin loss within a constraint set using Projected Gradient Descent (PGD). In this work, we introduce a relaxation term to the standard loss, that finds more suitable gradient-directions, increases attack efficacy and leads to more efficient adversarial training. We propose Guided Adversarial Margin Attack (GAMA), which utilizes function mapping of the clean image to guide the generation of adversaries, thereby resulting in stronger attacks. We evaluate our attack against multiple defenses and show improved performance when compared to existing attacks. Further, we propose Guided Adversarial Training (GAT), which achieves state-of-the-art performance amongst single-step defenses by utilizing the proposed relaxation term for both attack generation and training.
updated: Mon Nov 30 2020 16:39:39 GMT+0000 (UTC)
published: Mon Nov 30 2020 16:39:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト