Information-Theoretic Visual Explanation for Black-Box Classifiers
この作業では、情報理論の観点からブラックボックス分類器の予測を説明しようとします。入力機能ごとに、2つの情報理論的メトリックを使用して、その機能がある場合とない場合の分類器の出力を比較します。したがって、情報ゲイン(IG)マップとポイントワイズ相互情報(PMI)マップの2つのアトリビューションマップを取得します。 IGマップは、「各ピクセルはどの程度有益ですか?」に対するクラスに依存しない回答を提供し、PMIマップは、「各ピクセルが特定のクラスをどの程度サポートするか」のクラス固有の説明を提供します。既存の方法と比較して、私たちの方法は、定量的メトリックの観点からアトリビューションマップの正確性を向上させます。また、提案された方法を使用したImageNet分類器の詳細な分析を提供し、コードはオンラインで入手できます。
In this work, we attempt to explain the prediction of any black-box classifier from an information-theoretic perspective. For each input feature, we compare the classifier outputs with and without that feature using two information-theoretic metrics. Accordingly, we obtain two attribution maps--an information gain (IG) map and a point-wise mutual information (PMI) map. IG map provides a class-independent answer to "How informative is each pixel?", and PMI map offers a class-specific explanation of "How much does each pixel support a specific class?" Compared to existing methods, our method improves the correctness of the attribution maps in terms of a quantitative metric. We also provide a detailed analysis of an ImageNet classifier using the proposed method, and the code is available online.
updated: Fri Jul 16 2021 07:40:24 GMT+0000 (UTC)
published: Wed Sep 23 2020 13:51:16 GMT+0000 (UTC)
