反事実的説明は、その心理的妥当性、問題領域全体にわたる柔軟性、および提案された法的コンプライアンスにより、ブラックボックスの深層学習システムの予測を解明する eXplainable AI (XAI) 問題の一般的な解決策として浮上しています。 100以上の反事実的方法が存在し、人々が好むものと同様のもっともらしい説明を生成すると主張していますが、実際にユーザーでテストされたものはほとんどありません(〜7%).そのため、画像データの効果的な XAI に対するこれらの反事実アルゴリズムの心理的妥当性は確立されていません。この問題は、(i) 2 つのユーザー調査で、誤分類された画像に対して人間が生成したグラウンド トゥルースの反事実の説明を収集し、(ii) これらの人間が生成したグラウンド トゥルースの説明を計算によって生成された説明と比較するという新しい方法論を使用してここで対処されます。同じ誤分類について。結果は、人間が反事実の説明を生成するときに画像を「最小限に編集」しないことを示しています。代わりに、反事実クラスのプロトタイプをより適切に近似する、より大きな「意味のある」編集を行います。
Counterfactual explanations have emerged as a popular solution for the eXplainable AI (XAI) problem of elucidating the predictions of black-box deep-learning systems due to their psychological validity, flexibility across problem domains and proposed legal compliance. While over 100 counterfactual methods exist, claiming to generate plausible explanations akin to those preferred by people, few have actually been tested on users (∼7%). So, the psychological validity of these counterfactual algorithms for effective XAI for image data is not established. This issue is addressed here using a novel methodology that (i) gathers ground truth human-generated counterfactual explanations for misclassified images, in two user studies and, then, (ii) compares these human-generated ground-truth explanations to computationally-generated explanations for the same misclassifications. Results indicate that humans do not "minimally edit" images when generating counterfactual explanations. Instead, they make larger, "meaningful" edits that better approximate prototypes in the counterfactual class.