arXiv reaDer
LAFEAT:潜在機能を備えた敵対的防御を突き抜ける
LAFEAT: Piercing Through Adversarial Defenses with Latent Features
深い畳み込みニューラルネットワークは、敵対的な攻撃を受けやすくなっています。入力に小さな摂動を加えることにより、それらは簡単にだまされて誤った出力を与える可能性があります。これは、CNNをそのような攻撃に対して堅牢にする上で大きな課題を提示します。この目的のために、新しい防御技術の流入が提案されています。この論文では、特定の「ロバストな」モデルの潜在的な特徴が、驚くほど敵対的な攻撃を受けやすいことを示しています。これに加えて、最急降下法で潜在的な特徴を利用する、統一されたℓ_∞ノルムホワイトボックス攻撃アルゴリズム、つまりLAFEATを導入します。攻撃を成功させるために計算上はるかに効率的であるだけでなく、幅広い防御メカニズムにわたって現在の最先端技術よりも強力な敵であることを示します。これは、モデルの堅牢性が防御側の隠されたコンポーネントの効果的な使用に依存する可能性があることを示唆しており、全体的な観点から見るべきではありません。
Deep convolutional neural networks are susceptible to adversarial attacks. They can be easily deceived to give an incorrect output by adding a tiny perturbation to the input. This presents a great challenge in making CNNs robust against such attacks. An influx of new defense techniques have been proposed to this end. In this paper, we show that latent features in certain "robust" models are surprisingly susceptible to adversarial attacks. On top of this, we introduce a unified ℓ_∞-norm white-box attack algorithm which harnesses latent features in its gradient descent steps, namely LAFEAT. We show that not only is it computationally much more efficient for successful attacks, but it is also a stronger adversary than the current state-of-the-art across a wide range of defense mechanisms. This suggests that model robustness could be contingent on the effective use of the defender's hidden components, and it should no longer be viewed from a holistic perspective.
updated: Mon Apr 19 2021 13:22:20 GMT+0000 (UTC)
published: Mon Apr 19 2021 13:22:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト