Attention, Please! Adversarial Defense via Activation Rectification and Preservation
この研究は、敵対的攻撃と視覚的注意の変化との相関関係を調べることにより、敵対的攻撃の問題の新しい理解を提供します。特に、次のことが観察されました。(1) 注意領域が不完全な画像は、敵対的攻撃に対してより脆弱です。 (2)敵対的攻撃が成功すると、注意マップが逸脱して散らばってしまいます。したがって、注意ベースの敵対的防御フレームワークは、予測のために注意マップを同時に修正し、敵対的画像と元の画像の間の注意領域を維持するように設計されています。繰り返し攻撃されたサンプルを追加する問題も、視覚的注意の変化のコンテキストで説明されています。この研究の注意関連のデータ分析と防御ソリューションが、敵対的攻撃の背後にあるメカニズムに光を当て、将来の敵対的防御/攻撃モデルの設計を容易にすることを願っています.
This study provides a new understanding of the adversarial attack problem by examining the correlation between adversarial attack and visual attention change. In particular, we observed that: (1) images with incomplete attention regions are more vulnerable to adversarial attacks; and (2) successful adversarial attacks lead to deviated and scattered attention map. Accordingly, an attention-based adversarial defense framework is designed to simultaneously rectify the attention map for prediction and preserve the attention area between adversarial and original images. The problem of adding iteratively attacked samples is also discussed in the context of visual attention change. We hope the attention-related data analysis and defense solution in this study will shed some light on the mechanism behind the adversarial attack and also facilitate future adversarial defense/attack model design.
updated: Thu Dec 29 2022 02:19:43 GMT+0000 (UTC)
published: Sat Nov 24 2018 13:14:08 GMT+0000 (UTC)
