arXiv reaDer
Abs-CAM:畳み込みニューラルネットワークの説明のための勾配最適化解釈可能アプローチ
Abs-CAM: A Gradient Optimization Interpretable Approach for Explanation of Convolutional Neural Networks
ディープニューラルネットワーク(DNN)のブラックボックスの性質は、特定のシーンでのパフォーマンスの向上とアプリケーションを大幅に妨げます。近年、クラスアクティベーションマッピングベースの方法は、コンピュータビジョンタスクのモデルの内部決定を解釈するために広く使用されています。ただし、この方法でバックプロパゲーションを使用して勾配を取得すると、顕著性マップにノイズが発生し、決定に関係のない特徴を見つけることさえできます。本論文では、バックプロパゲーションから得られた勾配を最適化し、それらすべてを正の勾配に変換して出力ニューロンの活性化の視覚的特徴を強化し、改善する絶対値クラス活性化マッピングベース(Abs-CAM)法を提案します。顕著性マップのローカリゼーション能力。 Abs-CAMのフレームワークは、最初の顕著性マップの生成と最終的な顕著性マップの生成の2つのフェーズに分かれています。最初のフェーズでは、勾配を最適化することで顕著性マップのローカリゼーション能力を向上させ、2番目のフェーズでは、初期の顕著性マップを元の画像と線形に組み合わせて、顕著性マップの意味情報を強化します。削除、挿入、ポインティングゲームなど、提案手法の定性的・定量的評価を行っています。実験結果は、Abs-CAMが顕著性マップのノイズを明らかに除去し、意思決定に関連する特徴をより適切に特定でき、認識およびローカリゼーションタスクにおいて以前の方法よりも優れていることを示しています。
The black-box nature of Deep Neural Networks (DNNs) severely hinders its performance improvement and application in specific scenes. In recent years, class activation mapping-based method has been widely used to interpret the internal decisions of models in computer vision tasks. However, when this method uses backpropagation to obtain gradients, it will cause noise in the saliency map, and even locate features that are irrelevant to decisions. In this paper, we propose an Absolute value Class Activation Mapping-based (Abs-CAM) method, which optimizes the gradients derived from the backpropagation and turns all of them into positive gradients to enhance the visual features of output neurons' activation, and improve the localization ability of the saliency map. The framework of Abs-CAM is divided into two phases: generating initial saliency map and generating final saliency map. The first phase improves the localization ability of the saliency map by optimizing the gradient, and the second phase linearly combines the initial saliency map with the original image to enhance the semantic information of the saliency map. We conduct qualitative and quantitative evaluation of the proposed method, including Deletion, Insertion, and Pointing Game. The experimental results show that the Abs-CAM can obviously eliminate the noise in the saliency map, and can better locate the features related to decisions, and is superior to the previous methods in recognition and localization tasks.
updated: Fri Jul 08 2022 02:06:46 GMT+0000 (UTC)
published: Fri Jul 08 2022 02:06:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト