A Data-driven Adversarial Examples Recognition Framework via Adversarial Feature Genome
敵対的な例は、畳み込みニューラルネットワーク(CNN)に多くのセキュリティ上の脅威をもたらします。ほとんどの防御アルゴリズムは、元の画像と敵対的な例の違いを見つけることで、これらの脅威を防ぎます。ただし、見つかった違いにはクラスに関する機能が含まれていないため、これらの防御アルゴリズムは、正しいラベルを復元せずに、敵対的な例のみを検出できます。この点で、我々は、クラスに関する違いと特徴の両方を含む新しいタイプのデータである、敵対的特徴ゲノム(AFG)を提案します。この方法は、観察された現象、つまり、元の画像の特徴マップと敵対的な例の特徴マップの差が層が深くなるほど大きくなる敵対的特徴分離可能性(AFS)に触発されています。さらに、敵対的な例を検出し、正しいラベルを復元できる敵対的な例の認識フレームワークをさらに開発します。実験では、AFGによる敵対的な例の検出と分類は、さまざまな攻撃シナリオで90.01%を超える精度を持っています。私たちの知る限り、私たちの方法は、攻撃の検出と回復の両方に焦点を当てた最初の方法です。 AFGは、CNNの堅牢性を向上させるための新しいデータ駆動型の視点を提供します。ソースコードはで入手できます。
Adversarial examples pose many security threats to convolutional neural networks (CNNs). Most defense algorithms prevent these threats by finding differences between the original images and adversarial examples. However, the found differences do not contain features about the classes, so these defense algorithms can only detect adversarial examples without recovering the correct labels. In this regard, we propose the Adversarial Feature Genome (AFG), a novel type of data that contains both the differences and features about classes. This method is inspired by an observed phenomenon, namely the Adversarial Feature Separability (AFS), where the difference between the feature maps of the original images and adversarial examples becomes larger with deeper layers. On top of that, we further develop an adversarial example recognition framework that detects adversarial examples and can recover the correct labels. In the experiments, the detection and classification of adversarial examples by AFGs has an accuracy of more than 90.01% in various attack scenarios. To the best of our knowledge, our method is the first method that focuses on both attack detecting and recovering. AFG gives a new data-driven perspective to improve the robustness of CNNs. The source code is available at
updated: Wed Jan 26 2022 16:50:45 GMT+0000 (UTC)
published: Tue Dec 25 2018 10:31:36 GMT+0000 (UTC)
