arXiv reaDer
特徴アトリビューション手法の有効性と自動評価スコアとの相関
The effectiveness of feature attribution methods and its correlation with automatic evaluation scores
人工知能 (AI) モデルの決定を説明することは、現実世界の多くの重要なアプリケーションでますます重要になっています。何百もの論文が、新しい特徴アトリビューション手法を提案したり、研究にこれらのツールを議論したり利用したりしてきました。ただし、人間がターゲット エンド ユーザーであるにもかかわらず、ほとんどのアトリビューション メソッドは、プロキシの自動評価メトリクスでのみ評価されていました。この論文では、320 人の一般ユーザーと 11 人の専門家ユーザーに関する最初の大規模なユーザー調査を実施し、ImageNet 分類、Stanford Dogs の詳細な分類で人間を支援するための最先端のアトリビューション手法の有効性に光を当てます。 、およびこれらの 2 つのタスクですが、入力画像に敵対的な摂動が含まれている場合。全体として、特徴アトリビューションは、トレーニング セットの例に最も近い人間を示すよりも驚くほど効果的ではないことがわかりました。きめ細かい犬の分類という難しい作業では、人間の属性マップを提示することは役に立ちませんが、代わりに、AI のみと比較して人間と AI チームのパフォーマンスを低下させます。重要なことは、自動アトリビューション マップ評価測定値が、実際の人間と AI チームのパフォーマンスとの相関性が低いことがわかったことです。私たちの調査結果は、コミュニティがダウンストリームのヒューマンインザループアプリケーションでメソッドを厳密にテストし、既存の評価指標を再考することを奨励しています。
Explaining the decisions of an Artificial Intelligence (AI) model is increasingly critical in many real-world, high-stake applications. Hundreds of papers have either proposed new feature attribution methods, discussed or harnessed these tools in their work. However, despite humans being the target end-users, most attribution methods were only evaluated on proxy automatic-evaluation metrics. In this paper, we conduct the first, large-scale user study on 320 lay and 11 expert users to shed light on the effectiveness of state-of-the-art attribution methods in assisting humans in ImageNet classification, Stanford Dogs fine-grained classification, and these two tasks but when the input image contains adversarial perturbations. We found that, in overall, feature attribution is surprisingly not more effective than showing humans nearest training-set examples. On a hard task of fine-grained dog categorization, presenting attribution maps to humans does not help, but instead hurts the performance of human-AI teams compared to AI alone. Importantly, we found automatic attribution-map evaluation measures to correlate poorly with the actual human-AI team performance. Our findings encourage the community to rigorously test their methods on the downstream human-in-the-loop applications and to rethink the existing evaluation metrics.
updated: Mon May 31 2021 13:23:50 GMT+0000 (UTC)
published: Mon May 31 2021 13:23:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト