TbExplain: 統計的予測補正を備えたシーン分類モデルのテキストベースの説明方法
TbExplain: A Text-based Explanation Method for Scene Classification Models with the Statistical Prediction Correction
Explainable Artificial Intelligence (XAI) の分野は、ブラックボックス機械学習モデルの解釈可能性を向上させることを目的としています。入力フィーチャの重要度の値に基づいてヒートマップを構築することは、予測を行う際にそのようなモデルの基礎となる機能を説明するための一般的な方法です。ヒートマップは人間にはほぼ理解可能ですが、欠陥がないわけではありません。たとえば、専門家でないユーザーは、ヒートマップのロジック (モデルの予測に関連するピクセルが異なる強度や色で強調表示されるロジック) を完全に理解していない可能性があります。さらに、モデル予測に関連する入力画像のオブジェクトと領域は、ヒートマップによって完全には区別されないことがよくあります。この論文では、シーン分類モデルのテキストベースの説明を提示するために、XAI 技術と事前トレーニングされたオブジェクト検出器を採用する TbExplain と呼ばれるフレームワークを提案します。さらに、TbExplain には、最初の予測が信頼できない場合に、入力画像内のオブジェクトの統計に基づいて予測を修正し、テキストで説明する新しい方法が組み込まれています。テキストベースの説明の信頼性と妥当性を評価するために、定性実験を実施したところ、これらの説明は十分に信頼できることがわかりました。さらに、シーン分類データセットを使用した TbExplain での定量的および定性的な実験により、ResNet バリアントに比べて分類精度が向上していることが明らかになりました。
The field of Explainable Artificial Intelligence (XAI) aims to improve the interpretability of black-box machine learning models. Building a heatmap based on the importance value of input features is a popular method for explaining the underlying functions of such models in producing their predictions. Heatmaps are almost understandable to humans, yet they are not without flaws. Non-expert users, for example, may not fully understand the logic of heatmaps (the logic in which relevant pixels to the model's prediction are highlighted with different intensities or colors). Additionally, objects and regions of the input image that are relevant to the model prediction are frequently not entirely differentiated by heatmaps. In this paper, we propose a framework called TbExplain that employs XAI techniques and a pre-trained object detector to present text-based explanations of scene classification models. Moreover, TbExplain incorporates a novel method to correct predictions and textually explain them based on the statistics of objects in the input image when the initial prediction is unreliable. To assess the trustworthiness and validity of the text-based explanations, we conducted a qualitative experiment, and the findings indicated that these explanations are sufficiently reliable. Furthermore, our quantitative and qualitative experiments on TbExplain with scene classification datasets reveal an improvement in classification accuracy over ResNet variants.
updated: Mon Jul 08 2024 09:40:03 GMT+0000 (UTC)
published: Wed Jul 19 2023 14:23:26 GMT+0000 (UTC)
