非常に正確だが自信過剰なモデルは、ヘルスケアや自動運転などの重要なアプリケーションへの展開には適していません。分類結果は、決定境界の近くにあるあいまいな分布内サンプルの高い不確実性を反映する必要があります。また、モデルは、トレーニング分布のはるか外側にあるサンプル、分布から遠く離れた (OOD に近い) サンプル、またはトレーニング分布の近くにある新しいクラスからの目に見えないサンプル (OOD に近い) に対して、自信過剰な決定を行うことも控える必要があります。 .この論文では、自信過剰な分類器を修正する際の反事実的説明の適用を提案します。具体的には、予測性能を維持しながら不確実性特性を修正するために、反事実説明器 (ACE) からの拡張機能を使用して、事前にトレーニングされた特定の分類器を微調整することを提案します。遠い OOD、近い OOD、およびあいまいなサンプルを検出する広範な実験を実行します。私たちの経験的結果は、改訂されたモデルが不確実性の尺度を改善し、そのパフォーマンスが最先端の方法に匹敵することを示しています。
A highly accurate but overconfident model is ill-suited for deployment in critical applications such as healthcare and autonomous driving. The classification outcome should reflect a high uncertainty on ambiguous in-distribution samples that lie close to the decision boundary. The model should also refrain from making overconfident decisions on samples that lie far outside its training distribution, far-out-of-distribution (far-OOD), or on unseen samples from novel classes that lie near its training distribution (near-OOD). This paper proposes an application of counterfactual explanations in fixing an over-confident classifier. Specifically, we propose to fine-tune a given pre-trained classifier using augmentations from a counterfactual explainer (ACE) to fix its uncertainty characteristics while retaining its predictive performance. We perform extensive experiments with detecting far-OOD, near-OOD, and ambiguous samples. Our empirical results show that the revised model have improved uncertainty measures, and its performance is competitive to the state-of-the-art methods.