arXiv reaDer
誤った相関関係を特定し、説明ベースの学習で修正する
Identifying Spurious Correlations and Correcting them with an Explanation-based Learning
訓練されたモデルによって学習された誤った相関関係を特定することは、訓練されたモデルを改良し、信頼できるモデルを構築するための核心です。画像分類問題用にトレーニングされたモデルによって学習された偽の相関を識別する簡単な方法を提示します。画像レベルの摂動を適用し、トレーニング済みモデルを使用して行われた予測の確実性の変化を監視します。合成的に生成されたスプリアス領域を含む画像を含む画像分類データセットを使用してこのアプローチを示し、トレーニングされたモデルがスプリアス領域に過度に依存していたことを示します。さらに、説明ベースの学習アプローチを使用して、学習した誤った相関関係を削除します。
Identifying spurious correlations learned by a trained model is at the core of refining a trained model and building a trustworthy model. We present a simple method to identify spurious correlations that have been learned by a model trained for image classification problems. We apply image-level perturbations and monitor changes in certainties of predictions made using the trained model. We demonstrate this approach using an image classification dataset that contains images with synthetically generated spurious regions and show that the trained model was overdependent on spurious regions. Moreover, we remove the learned spurious correlations with an explanation based learning approach.
updated: Tue Nov 15 2022 16:34:53 GMT+0000 (UTC)
published: Tue Nov 15 2022 16:34:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト