Interpretations are useful: penalizing explanations to align neural networks with prior knowledge
ディープラーニングモデルの説明を効果的にするには、モデルへの洞察を提供し、目的を達成するために対応するアクションを提案する必要があります。多くの場合、提案可能な説明可能なディープラーニングメソッドのリタニーは最初のステップで停止し、実践者にモデルへの洞察を提供しますが、それに基づいて行動する方法はありません。この論文では、ディープラーニングモデルの予測精度を高めるために、実務者が既存の説明方法を活用できるようにする方法である、コンテキスト分解説明ペナルティ(CDEP)を提案します。特に、モデルが一部の機能に誤って重要度を割り当てていることが示された場合、CDEPは、提供された説明を直接正規化することにより、開業医がこれらのエラーを修正できるようにします。文脈分解(CD)(Murdoch et al。、2018)によって提供される説明を使用して、おもちゃの配列と実際のデータセットのパフォーマンスを向上させる方法の能力を示します。
For an explanation of a deep learning model to be effective, it must provide both insight into a model and suggest a corresponding action in order to achieve some objective. Too often, the litany of proposed explainable deep learning methods stop at the first step, providing practitioners with insight into a model, but no way to act on it. In this paper, we propose contextual decomposition explanation penalization (CDEP), a method which enables practitioners to leverage existing explanation methods in order to increase the predictive accuracy of deep learning models. In particular, when shown that a model has incorrectly assigned importance to some features, CDEP enables practitioners to correct these errors by directly regularizing the provided explanations. Using explanations provided by contextual decomposition (CD) (Murdoch et al., 2018), we demonstrate the ability of our method to increase performance on an array of toy and real datasets.
updated: Thu Oct 08 2020 12:43:21 GMT+0000 (UTC)
published: Mon Sep 30 2019 11:02:01 GMT+0000 (UTC)
