arXiv reaDer
ECINN:可逆ニューラルネットワークからの効率的な反事実
ECINN: Efficient Counterfactuals from Invertible Neural Networks
反事実的な例は、入力を変更して分類器の予測クラスを変更する方法を特定します。これにより、ディープニューラルネットワークなどのブラックボックスの性質が開かれます。画像分類のために可逆ニューラルネットワークの生成能力を利用して反事実的な例を効率的に生成する方法、ECINNを提案します。分類子の1000以上の評価を必要とすることがある競合するメソッドとは対照的に、ECINNは閉じた形式の式を持ち、2回の評価だけで反事実を生成します。間違いなく、反事実的な例を生成する際の主な課題は、予測された結果に影響を与える入力特徴、つまりクラス依存の特徴のみを変更することです。私たちの実験は、ECINNがクラス依存の画像領域を変更して、反事実の知覚クラスと予測クラスを変更する方法を示しています。さらに、ECINNを拡張してヒートマップ(ECINNh)も生成し、生成された反事実例のペアごとのクラス依存の変更などを簡単に検査できるようにします。実験的に、ECINNhは、ヒートマップベースの説明を生成する確立された方法よりも優れていることがわかりました。
Counterfactual examples identify how inputs can be altered to change the predicted class of a classifier, thus opening up the black-box nature of, e.g., deep neural networks. We propose a method, ECINN, that utilizes the generative capacities of invertible neural networks for image classification to generate counterfactual examples efficiently. In contrast to competing methods that sometimes need a thousand evaluations or more of the classifier, ECINN has a closed-form expression and generates a counterfactual in the time of only two evaluations. Arguably, the main challenge of generating counterfactual examples is to alter only input features that affect the predicted outcome, i.e., class-dependent features. Our experiments demonstrate how ECINN alters class-dependent image regions to change the perceptual and predicted class of the counterfactuals. Additionally, we extend ECINN to also produce heatmaps (ECINNh) for easy inspection of, e.g., pairwise class-dependent changes in the generated counterfactual examples. Experimentally, we find that ECINNh outperforms established methods that generate heatmap-based explanations.
updated: Thu Mar 25 2021 09:23:24 GMT+0000 (UTC)
published: Thu Mar 25 2021 09:23:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト