Saliency Methods for Explaining Adversarial Attacks
この作業では、顕著性法を使用して敵の画像の分類を説明することを目指しています。顕著性メソッドは、顕著性マップを作成することにより、ニューラルネットワークの個々の分類決定を説明します。すべての顕著性方法は、正しい予測を説明するために提案されました。最近の研究は、多くの提案された顕著性方法が予測を説明できないことを示しています。特に、Guided Backpropagation(GuidedBP)は基本的に(部分的な)イメージリカバリを実行しています。私たちの仕事では、数値分析により、GuidedBPによって作成された顕著性マップにはクラス識別情報が含まれていることが示されています。作成された顕著性マップを強化するためのシンプルで効率的な方法を提案します。提案された強化されたGuidedBPは、敵の分類を説明するための最先端の顕著性メソッドです。
In this work, we aim to explain the classifications of adversary images using saliency methods. Saliency methods explain individual classification decisions of neural networks by creating saliency maps. All saliency methods were proposed for explaining correct predictions. Recent research shows that many proposed saliency methods fail to explain the predictions. Notably, the Guided Backpropagation (GuidedBP) is essentially doing (partial) image recovery. In our work, our numerical analysis shows the saliency maps created by GuidedBP do contain class-discriminative information. We propose a simple and efficient way to enhance the created saliency maps. The proposed enhanced GuidedBP is the state-of-the-art saliency method to explain adversary classifications.
updated: Thu Aug 22 2019 14:44:02 GMT+0000 (UTC)
published: Thu Aug 22 2019 14:44:02 GMT+0000 (UTC)
