arXiv reaDer
中級レベルの攻撃による敵対者の例の転送可能性の強化
Enhancing Adversarial Example Transferability with an Intermediate Level Attack
 ニューラルネットワークは、訓練されたモデルを欺くために作成された悪意のある入力である敵対的な例に対して脆弱です。敵対者の例はしばしばブラックボックス転送を示します。つまり、あるモデルの敵対者の例は別のモデルを欺くことができます。ただし、通常、敵対的な例は、ソースモデルの特定のアーキテクチャおよび機能表現を活用するのに過剰なものであり、他のターゲットモデルへの準最適なブラックボックス転送攻撃をもたらします。中間レベル攻撃(ILA)を導入します。これは、ソースモデルの事前に指定されたレイヤーで摂動を増やし、最新技術を改善することにより、既存の敵対者の例を微調整してブラックボックスの転送性を向上させますメソッド。ターゲットモデルの知識がなくても摂動するソースモデルのレイヤーを選択して、高い転送性を実現できることを示します。さらに、私たちの方法に関するいくつかの説明的な洞察と、中間機能マップを使用した敵対的な例の最適化の効果を提供します。コードはhttps://github.com/CUVL/Intermediate-Level-Attackで入手できます。
Neural networks are vulnerable to adversarial examples, malicious inputs crafted to fool trained models. Adversarial examples often exhibit black-box transfer, meaning that adversarial examples for one model can fool another model. However, adversarial examples are typically overfit to exploit the particular architecture and feature representation of a source model, resulting in sub-optimal black-box transfer attacks to other target models. We introduce the Intermediate Level Attack (ILA), which attempts to fine-tune an existing adversarial example for greater black-box transferability by increasing its perturbation on a pre-specified layer of the source model, improving upon state-of-the-art methods. We show that we can select a layer of the source model to perturb without any knowledge of the target models while achieving high transferability. Additionally, we provide some explanatory insights regarding our method and the effect of optimizing for adversarial examples using intermediate feature maps. Our code is available at https://github.com/CUVL/Intermediate-Level-Attack.
updated: Thu Feb 27 2020 22:43:49 GMT+0000 (UTC)
published: Tue Jul 23 2019 23:37:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト