arXiv reaDer
幾何学的にガイドされた統合グラジエント
Geometrically Guided Integrated Gradients
ディープニューラルネットワークの解釈可能性の方法は、主に、元の入力または摂動された入力に対するクラススコアの感度に焦点を当てており、通常、実際の勾配または変更された勾配を使用して測定されます。一部の方法では、モデルにとらわれないアプローチを使用して、すべての予測の背後にある理論的根拠を理解します。この論文では、入力に対するモデルパラメータ空間のローカルジオメトリも事後説明の改善に役立つ可能性があることを主張し、実証します。この目標を達成するために、統合勾配法で従来使用されていた線形パスに沿った勾配計算に基づいて構築される、「幾何学的にガイドされた統合勾配」と呼ばれる解釈可能性方法を導入します。ただし、勾配情報を統合する代わりに、この方法では、入力の複数のスケーリングされたバージョンからモデルの動的な動作を調査し、各入力に対して可能な限り最良の属性を取得します。提案されたアプローチが主観的および定量的評価においてバニラおよび統合された勾配よりも優れていることを、広範な実験を通じて実証します。また、従来使用されていた「モデルのランダム化」テストを補完する「モデルの摂動」の健全性チェックを提案します。
Interpretability methods for deep neural networks mainly focus on the sensitivity of the class score with respect to the original or perturbed input, usually measured using actual or modified gradients. Some methods also use a model-agnostic approach to understanding the rationale behind every prediction. In this paper, we argue and demonstrate that local geometry of the model parameter space relative to the input can also be beneficial for improved post-hoc explanations. To achieve this goal, we introduce an interpretability method called "geometrically-guided integrated gradients" that builds on top of the gradient calculation along a linear path as traditionally used in integrated gradient methods. However, instead of integrating gradient information, our method explores the model's dynamic behavior from multiple scaled versions of the input and captures the best possible attribution for each input. We demonstrate through extensive experiments that the proposed approach outperforms vanilla and integrated gradients in subjective and quantitative assessment. We also propose a "model perturbation" sanity check to complement the traditionally used "model randomization" test.
updated: Thu Jun 16 2022 23:30:12 GMT+0000 (UTC)
published: Mon Jun 13 2022 05:05:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト