arXiv reaDer
より良い敵対的転移可能性のための高レベル機能の多様化
Diversifying the High-level Features for better Adversarial Transferability
ディープ ニューラル ネットワーク (DNN) に対する敵対的攻撃の大きな脅威を考えると、現実世界のアプリケーションを攻撃するための転送可能性を高めるために、数多くの研究が提案されてきました。ただし、既存の攻撃では高度な勾配計算や入力変換を利用することが多く、ホワイト ボックス モデルは無視されています。 DNN が優れたパフォーマンスのために過度にパラメータ化されているという事実に触発されて、より転送可能な敵対的な例のために高レベル機能 (DHF) を多様化することを提案します。特に、DHF は、各反復で勾配を計算するときに、高レベルの特徴をランダムに変換し、良性のサンプルの特徴と混合することによって、高レベルの特徴を乱します。パラメーターの冗長性により、このような変換は分類のパフォーマンスには影響しませんが、さまざまなモデル間で不変の特徴を識別するのに役立ち、転送可能性が大幅に向上します。 ImageNet データセットの経験的評価は、DHF が既存の運動量ベースの攻撃の転送可能性を効果的に改善できることを示しています。入力変換ベースの攻撃に組み込まれた DHF は、より転送可能な敵対的な例を生成し、いくつかの防御モデルを攻撃するときに明確なマージンでベースラインを上回り、さまざまな攻撃への一般化と転送可能性を高めるための高い有効性を示しています。
Given the great threat of adversarial attacks against Deep Neural Networks (DNNs), numerous works have been proposed to boost transferability to attack real-world applications. However, existing attacks often utilize advanced gradient calculation or input transformation but ignore the white-box model. Inspired by the fact that DNNs are over-parameterized for superior performance, we propose diversifying the high-level features (DHF) for more transferable adversarial examples. In particular, DHF perturbs the high-level features by randomly transforming the high-level features and mixing them with the feature of benign samples when calculating the gradient at each iteration. Due to the redundancy of parameters, such transformation does not affect the classification performance but helps identify the invariant features across different models, leading to much better transferability. Empirical evaluations on ImageNet dataset show that DHF could effectively improve the transferability of existing momentum-based attacks. Incorporated into the input transformation-based attacks, DHF generates more transferable adversarial examples and outperforms the baselines with a clear margin when attacking several defense models, showing its generalization to various attacks and high effectiveness for boosting transferability.
updated: Thu Apr 20 2023 07:44:59 GMT+0000 (UTC)
published: Thu Apr 20 2023 07:44:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト