arXiv reaDer
予測できないこと、理解できないこと:説明可能性手法のための人間中心の評価フレームワーク
What I Cannot Predict, I Do Not Understand: A Human-Centered Evaluation Framework for Explainability Methods
多数の説明可能性の方法と理論的評価スコアが提案されています。ただし、まだわかっていません。(1)これらの方法が実際のシナリオでどれほど有用であるか、および(2)理論的尺度が人間による実際の使用に対するこれらの方法の有用性をどれだけうまく予測するか。このギャップを埋めるために、人間の精神物理学実験を大規模に実施して、代表的な帰属方法を活用してさまざまな画像分類子の決定を予測することを学ぶ人間の参加者(n = 1,150)の能力を評価しました。私たちの結果は、説明可能性の方法をスコアリングするために使用される理論的尺度が、実際のシナリオにおける個々の帰属方法の実際的な有用性を十分に反映していないことを示しています。さらに、個々の帰属方法が人間の参加者が分類子の決定を予測するのにどの程度役立ったかは、分類タスクとデータセットによって大きく異なりました。全体として、私たちの結果は、この分野の基本的な課題を浮き彫りにします。これは、より良い説明可能性の方法を開発し、人間中心の評価アプローチを展開するという重大な必要性を示唆しています。フレームワークのコードを利用できるようにして、新しい説明可能性メソッドの体系的な評価を容易にします。
A multitude of explainability methods and theoretical evaluation scores have been proposed. However, it is not yet known: (1) how useful these methods are in real-world scenarios and (2) how well theoretical measures predict the usefulness of these methods for practical use by a human. To fill this gap, we conducted human psychophysics experiments at scale to evaluate the ability of human participants (n=1,150) to leverage representative attribution methods to learn to predict the decision of different image classifiers. Our results demonstrate that theoretical measures used to score explainability methods poorly reflect the practical usefulness of individual attribution methods in real-world scenarios. Furthermore, the degree to which individual attribution methods helped human participants predict classifiers' decisions varied widely across categorization tasks and datasets. Overall, our results highlight fundamental challenges for the field -- suggesting a critical need to develop better explainability methods and to deploy human-centered evaluation approaches. We will make the code of our framework available to ease the systematic evaluation of novel explainability methods.
updated: Mon Dec 06 2021 18:36:09 GMT+0000 (UTC)
published: Mon Dec 06 2021 18:36:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト