arXiv reaDer
十分に訓練されていない代理人を介したクエリフリーの敵対的転送
Query-Free Adversarial Transfer via Undertrained Surrogates
ディープニューラルネットワークは、敵対的な例に対して脆弱です。モデルの入力に小さな摂動が追加され、モデルが誤った予測を出力する原因になります。攻撃が生成される代理モデルをアンダートレーニングすることにより、ブラックボックス設定での敵対的攻撃の有効性を改善するための新しい方法を紹介します。 2つのデータセットと5つのモデルアーキテクチャを使用して、この方法がアーキテクチャ間でうまく転送され、最先端の方法よりも大幅に優れていることを示します。アプローチの有効性を、代理モデルの損失関数の曲率の減少とユニバーサル勾配特性の増加の関数として解釈し、転送可能性を妨げる局所的な損失の最大値の存在を減少させることを示します。私たちの結果は、強力な単一代理モデルを見つけることが、転送可能な敵対的攻撃を生成するための非常に効果的で簡単な方法であり、この方法がこの分野での将来の研究のための貴重なルートであることを示唆しています。
Deep neural networks are vulnerable to adversarial examples -- minor perturbations added to a model's input which cause the model to output an incorrect prediction. We introduce a new method for improving the efficacy of adversarial attacks in a black-box setting by undertraining the surrogate model which the attacks are generated on. Using two datasets and five model architectures, we show that this method transfers well across architectures and outperforms state-of-the-art methods by a wide margin. We interpret the effectiveness of our approach as a function of reduced surrogate model loss function curvature and increased universal gradient characteristics, and show that our approach reduces the presence of local loss maxima which hinder transferability. Our results suggest that finding strong single surrogate models is a highly effective and simple method for generating transferable adversarial attacks, and that this method represents a valuable route for future study in this field.
updated: Sat Nov 28 2020 06:05:53 GMT+0000 (UTC)
published: Wed Jul 01 2020 23:12:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト