顕著性手法は、学習したモデルの予測に関連すると見なされる入力の特徴を強調するための一般的なツールとして登場しました。いくつかの顕著性の方法が提案されており、多くの場合、画像データの視覚的なアピールによって導かれます。この作業では、特定の方法で提供できる説明と提供できない説明の種類を評価するための実用的な方法論を提案します。視覚的評価のみに依存することは誤解を招く可能性があることがわかりました。広範な実験を通じて、いくつかの既存の顕著性手法がモデルとデータ生成プロセスの両方から独立していることを示しています。したがって、提案されたテストに失敗する方法は、データ内の外れ値の検出、モデルが学習した入力と出力の関係の説明、モデルのデバッグなど、データまたはモデルのいずれかに敏感なタスクには不十分です。トレーニングデータもモデルも必要としない手法である、画像のエッジ検出との類似性を通じて、調査結果を解釈します。線形モデルと単層畳み込みニューラルネットワークの場合の理論は、実験結果を裏付けています。
Saliency methods have emerged as a popular tool to highlight features in an input deemed relevant for the prediction of a learned model. Several saliency methods have been proposed, often guided by visual appeal on image data. In this work, we propose an actionable methodology to evaluate what kinds of explanations a given method can and cannot provide. We find that reliance, solely, on visual assessment can be misleading. Through extensive experiments we show that some existing saliency methods are independent both of the model and of the data generating process. Consequently, methods that fail the proposed tests are inadequate for tasks that are sensitive to either data or model, such as, finding outliers in the data, explaining the relationship between inputs and outputs that the model learned, and debugging the model. We interpret our findings through an analogy with edge detection in images, a technique that requires neither training data nor model. Theory in the case of a linear model and a single-layer convolutional neural network supports our experimental findings.