Learning Transferable Adversarial Examples via Ghost Networks
 敵対攻撃の最近の開発により、アンサンブルベースの方法は、ブラックボックス攻撃において従来のアンサンブルでない方法よりも優れていることが証明されています。ただし、多様なモデルのファミリを取得することは計算上禁止されているため、これらの方法では、アンサンブルするモデルの数が限られているため、パフォーマンスが低下します。この論文では、敵対者の例の転送可能性を改善するためにゴーストネットワークを提案します。ゴーストネットワークの重要な原則は、機能レベルの摂動を既存のモデルに適用して、多様なモデルの巨大なセットを潜在的に作成することです。その後、モデルは縦方向のアンサンブルによって融合されます。広範な実験結果は、ネットワークの数が敵の例の転送可能性を改善するために不可欠であることを示唆しているが、異なるネットワークを独立して訓練し、集約的な集約方法でそれらを組み立てる必要性は低い。代わりに、私たちの仕事を計算的に安価で簡単に適用できるプラグインとして使用して、単一モデル攻撃とマルチモデル攻撃の両方で、残留および非残留ネットワークと互換性のある敵対的アプローチを改善できます。 NeurIPS 2017の敵対的な競争を再現することにより、この方法はNo.1攻撃の提出よりも大幅に優れており、その有効性と効率性を実証しています。コードはで入手できます。
Recent development of adversarial attacks has proven that ensemble-based methods outperform traditional, non-ensemble ones in black-box attack. However, as it is computationally prohibitive to acquire a family of diverse models, these methods achieve inferior performance constrained by the limited number of models to be ensembled. In this paper, we propose Ghost Networks to improve the transferability of adversarial examples. The critical principle of ghost networks is to apply feature-level perturbations to an existing model to potentially create a huge set of diverse models. After that, models are subsequently fused by longitudinal ensemble. Extensive experimental results suggest that the number of networks is essential for improving the transferability of adversarial examples, but it is less necessary to independently train different networks and ensemble them in an intensive aggregation way. Instead, our work can be used as a computationally cheap and easily applied plug-in to improve adversarial approaches both in single-model and multi-model attack, compatible with residual and non-residual networks. By reproducing the NeurIPS 2017 adversarial competition, our method outperforms the No.1 attack submission by a large margin, demonstrating its effectiveness and efficiency. Code is available at
updated: Mon Nov 25 2019 15:34:55 GMT+0000 (UTC)
published: Sun Dec 09 2018 02:11:03 GMT+0000 (UTC)
