畳み込みニューラルネットワーク(CNN)は、画像分類の分野で最先端になりました。ただし、その内部表現についてすべてが理解されているわけではありません。この論文では、マルチクラス分類問題に対するCNNの予測の解釈可能性と説明可能性に取り組んでいます。具体的には、Softmax-Gradient Layer-wise Relevance Propagation(SGLRP)と呼ばれるピクセル単位の入力属性の新しい視覚化方法を提案します。提案されたモデルは、出力確率の関連性を入力画像に逆伝播するために、softmaxの勾配を使用して、Deep Taylor Decomposition(DTD)のクラス判別拡張です。定性的および定量的分析を通じて、SGLRPがターゲットオブジェクトの分類に寄与する入力画像上の領域を正常にローカライズおよび属性付けできることを実証します。提案された方法が、画像内の他の可能性のあるオブジェクトからターゲットオブジェクトクラスを区別するのに優れていることを示します。 SGLRPは、既存のLayer-wise Relevance Propagation(LRP)ベースの方法よりも優れたパフォーマンスを発揮し、CNNの決定プロセスの理解に役立つことを確認します。
Convolutional Neural Networks (CNN) have become state-of-the-art in the field of image classification. However, not everything is understood about their inner representations. This paper tackles the interpretability and explainability of the predictions of CNNs for multi-class classification problems. Specifically, we propose a novel visualization method of pixel-wise input attribution called Softmax-Gradient Layer-wise Relevance Propagation (SGLRP). The proposed model is a class discriminate extension to Deep Taylor Decomposition (DTD) using the gradient of softmax to back propagate the relevance of the output probability to the input image. Through qualitative and quantitative analysis, we demonstrate that SGLRP can successfully localize and attribute the regions on input images which contribute to a target object's classification. We show that the proposed method excels at discriminating the target objects class from the other possible objects in the images. We confirm that SGLRP performs better than existing Layer-wise Relevance Propagation (LRP) based methods and can help in the understanding of the decision process of CNNs.