arXiv reaDer
敵対的攻撃を説明するための顕著性手法
Saliency Methods for Explaining Adversarial Attacks
  ニューラルネットワークの分類決定は、わずかな知覚できない摂動によって誤解される可能性があります。この作業は、顕著性の方法を使用して誤解された分類を説明することを目的としています。顕著性メソッドの背後にある考え方は、いわゆる顕著性マップを作成することにより、ニューラルネットワークの分類決定を説明することです。残念ながら、最近の多くの出版物は、提案された顕著性法の多くが洞察に富んだ説明を提供しないことを示しています。顕著な例は、ガイド付き逆伝播法(GuidedBP)で、単純に(部分的な)イメージリカバリを実行します。ただし、数値分析では、GuidedBPによって作成された顕著性マップには実際にクラス識別情報が含まれていることが示されています。顕著性マップを強化するためのシンプルで効率的な方法を提案します。提案された強化されたGuidedBPは、敵の分類を説明するための最新のパフォーマンスを示しています。
The classification decisions of neural networks can be misled by small imperceptible perturbations. This work aims to explain the misled classifications using saliency methods. The idea behind saliency methods is to explain the classification decisions of neural networks by creating so-called saliency maps. Unfortunately, a number of recent publications have shown that many of the proposed saliency methods do not provide insightful explanations. A prominent example is Guided Backpropagation (GuidedBP), which simply performs (partial) image recovery. However, our numerical analysis shows the saliency maps created by GuidedBP do indeed contain class-discriminative information. We propose a simple and efficient way to enhance the saliency maps. The proposed enhanced GuidedBP shows the state-of-the-art performance to explain adversary classifications.
updated: Mon Oct 21 2019 11:36:36 GMT+0000 (UTC)
published: Thu Aug 22 2019 14:44:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト