arXiv reaDer
トレーニングインスタンスの影響の効率的な推定
Efficient Estimation of Influence of a Training Instance
ニューラルネットワークモデルに対するトレーニングインスタンスの影響を理解することは、解釈可能性の向上につながります。ただし、影響を評価することは困難で非効率的です。これは、トレーニングインスタンスが使用されなかった場合にモデルの予測がどのように変更されるかを示しています。本論文では、影響を推定するための効率的な方法を提案する。私たちの方法は、サブネットワークをゼロマスクし、サブネットワークが各トレーニングインスタンスを学習するのを防ぐドロップアウトに触発されています。ドロップアウトマスクを切り替えることで、各トレーニングインスタンスを学習した、または学習しなかったサブネットワークを使用して、その影響を推定できます。分類データセットに対するBERTとVGGNetの実験を通じて、提案された方法がトレーニングの影響をキャプチャし、エラー予測の解釈可能性を高め、一般化を改善するためにトレーニングデータセットをクレンジングできることを示します。
Understanding the influence of a training instance on a neural network model leads to improving interpretability. However, it is difficult and inefficient to evaluate the influence, which shows how a model's prediction would be changed if a training instance were not used. In this paper, we propose an efficient method for estimating the influence. Our method is inspired by dropout, which zero-masks a sub-network and prevents the sub-network from learning each training instance. By switching between dropout masks, we can use sub-networks that learned or did not learn each training instance and estimate its influence. Through experiments with BERT and VGGNet on classification datasets, we demonstrate that the proposed method can capture training influences, enhance the interpretability of error predictions, and cleanse the training dataset for improving generalization.
updated: Tue Dec 08 2020 04:31:38 GMT+0000 (UTC)
published: Tue Dec 08 2020 04:31:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト