SmoothFool: An Efficient Framework for Computing Smooth Adversarial Perturbations
  ディープニューラルネットワークは、入力ドメインでの敵対的操作の影響を受けやすくなっています。 $ \ ell_p $ -boundedおよび$ \ ell_p $ -minimalの敵対的摂動の場合、脆弱性の範囲が集中的に調査されました。ただし、特定の統計的特性または周波数領域の特性を持つ敵対的摂動に対するDNNの脆弱性は十分に調査されていません。この論文では、摂動の滑らかさを研究し、滑らかで敵対的な摂動を計算するための一般的で計算効率の高いフレームワークであるSmoothFoolを提案します。広範な実験を通じて、ホワイトボックスとブラックボックスの両方の攻撃シナリオに対する提案手法の有効性を検証します。具体的には、(i)確立され広く使用されているネットワークアーキテクチャに非常に滑らかな敵対的摂動が存在すること、(ii)滑らかさが最先端の防御メカニズムに対する摂動の堅牢性を大幅に高めること、(iii)滑らかさは、データポイントとネットワークアーキテクチャの両方にわたる敵対的摂動の伝達性を向上させ、(iv)クラスカテゴリは、滑らかな摂動に対する可変範囲の感受性を示します。私たちの結果は、DNNの脆弱性の範囲を敵の例に探る上で、スムーズなAPが重要な役割を果たすことを示唆しています。
Deep neural networks are susceptible to adversarial manipulations in the input domain. The extent of vulnerability has been explored intensively in cases of $\ell_p$-bounded and $\ell_p$-minimal adversarial perturbations. However, the vulnerability of DNNs to adversarial perturbations with specific statistical properties or frequency-domain characteristics has not been sufficiently explored. In this paper, we study the smoothness of perturbations and propose SmoothFool, a general and computationally efficient framework for computing smooth adversarial perturbations. Through extensive experiments, we validate the efficacy of the proposed method for both the white-box and black-box attack scenarios. In particular, we demonstrate that: (i) there exist extremely smooth adversarial perturbations for well-established and widely used network architectures, (ii) smoothness significantly enhances the robustness of perturbations against state-of-the-art defense mechanisms, (iii) smoothness improves the transferability of adversarial perturbations across both data points and network architectures, and (iv) class categories exhibit a variable range of susceptibility to smooth perturbations. Our results suggest that smooth APs can play a significant role in exploring the vulnerability extent of DNNs to adversarial examples.
updated: Tue Oct 08 2019 18:22:21 GMT+0000 (UTC)
published: Tue Oct 08 2019 18:22:21 GMT+0000 (UTC)
