arXiv reaDer
敵対的攻撃のための適応摂動
Adaptive Perturbation for Adversarial Attack
近年、深層学習モデルのセキュリティは、敵対的な例に対して脆弱なニューラルネットワークの急速な発展によりますます注目を集めています。ほとんどすべての既存の勾配ベースの攻撃方法は、L_∞ノルムの摂動バジェットの要件を満たすために生成で符号関数を使用します。ただし、符号関数は正確な勾配方向を変更するため、敵対的な例を生成するには不適切である可能性があることがわかります。符号関数を削除し、スケーリング係数を使用して正確な勾配方向を直接利用して、敵対的摂動を生成することを提案します。これにより、摂動が少なくても敵対的例の攻撃成功率が向上します。さらに、最適なスケーリング係数は画像によって異なることを考慮して、各画像に適切なスケーリング係数を探すための適応スケーリング係数ジェネレーターを提案します。これにより、スケーリング係数を手動で検索するための計算コストを回避できます。私たちの方法は、攻撃の成功率をさらに向上させるために、ほとんどすべての既存の勾配ベースの攻撃方法と統合することができます。 CIFAR10およびImageNetデータセットでの広範な実験は、私たちの方法がより高い転送可能性を示し、最先端の方法よりも優れていることを示しています。
In recent years, the security of deep learning models achieves more and more attentions with the rapid development of neural networks, which are vulnerable to adversarial examples. Almost all existing gradient-based attack methods use the sign function in the generation to meet the requirement of perturbation budget on L_∞ norm. However, we find that the sign function may be improper for generating adversarial examples since it modifies the exact gradient direction. We propose to remove the sign function and directly utilize the exact gradient direction with a scaling factor for generating adversarial perturbations, which improves the attack success rates of adversarial examples even with fewer perturbations. Moreover, considering that the best scaling factor varies across different images, we propose an adaptive scaling factor generator to seek an appropriate scaling factor for each image, which avoids the computational cost for manually searching the scaling factor. Our method can be integrated with almost all existing gradient-based attack methods to further improve the attack success rates. Extensive experiments on the CIFAR10 and ImageNet datasets show that our method exhibits higher transferability and outperforms the state-of-the-art methods.
updated: Sat Nov 27 2021 07:57:41 GMT+0000 (UTC)
published: Sat Nov 27 2021 07:57:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト