arXiv reaDer
EDDA: モデルと説明の整合性を改善するための説明駆動型データ拡張
EDDA: Explanation-driven Data Augmentation to Improve Model and Explanation Alignment
近年、画像分類器の予測の事後説明可能性のためのさまざまな方法が導入されています。ただし、これらの事後説明は、分類子の予測と常に完全に一致するとは限らないため、そのような説明に基づいてモデルをデバッグしようとすると、重大な問題が発生します。この目的のために、モデルと説明クラスの両方にとらわれず、グラウンド トゥルースの説明を必要としない、モデルの予測と説明方法の間の整合性を改善できる方法論を探しています。モデルの説明に起因する既存のデータのオクルージョンでトレーニング データを拡張する、新しい説明駆動型データ拡張 (EDDA) メソッドを通じてこれを実現します。これは、モデル予測のために顕著な領域を塞ぐと予測におけるモデルの信頼性が低下し、非顕著な領域を塞ぐと予測が変更されないという単純な動機付けの原則に基づいています。この拡張方法がモデルと説明者のアライメントを改善することを確認するために、さまざまなデータセット、画像分類モデル、および説明方法で方法論を評価します。すべての場合において、説明駆動型データ拡張方法が、データ拡張なしおよび非説明駆動型データ拡張方法と比較して、モデルと説明の整合性を改善することを確認します。結論として、このアプローチは、モデルの予測と説明の間の整合性を改善するための新しいモデルおよび説明者に依存しない方法論を提供します。これは、画像分類モデルの実用的な展開とデバッグのための重要な前進と見なされます。
Recent years have seen the introduction of a range of methods for post-hoc explainability of image classifier predictions. However, these post-hoc explanations may not always align perfectly with classifier predictions, which poses a significant challenge when attempting to debug models based on such explanations. To this end, we seek a methodology that can improve alignment between model predictions and explanation method that is both agnostic to the model and explanation classes and which does not require ground truth explanations. We achieve this through a novel explanation-driven data augmentation (EDDA) method that augments the training data with occlusions of existing data stemming from model-explanations; this is based on the simple motivating principle that occluding salient regions for the model prediction should decrease the model confidence in the prediction, while occluding non-salient regions should not change the prediction -- if the model and explainer are aligned. To verify that this augmentation method improves model and explainer alignment, we evaluate the methodology on a variety of datasets, image classification models, and explanation methods. We verify in all cases that our explanation-driven data augmentation method improves alignment of the model and explanation in comparison to no data augmentation and non-explanation driven data augmentation methods. In conclusion, this approach provides a novel model- and explainer-agnostic methodology for improving alignment between model predictions and explanations, which we see as a critical step forward for practical deployment and debugging of image classification models.
updated: Sat Jun 19 2021 00:01:42 GMT+0000 (UTC)
published: Sat May 29 2021 00:42:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト