解釈可能性は、機械学習システムへの信頼を構築するための重要な側面として浮上してきました。これは、他の方法ではユーザーに不透明な複雑なニューラルネットワークの動作に関する洞察を提供することを目的としています。データセット内の典型的なサンプルの識別から、画像予測の説明や誤分類の説明に至るまで、解釈可能性のさまざまな側面に対処する既存のソリューションは多数あります。これらの多様な手法はすべて、一見異なる解釈可能性の側面に対処しますが、解釈可能性タスクの大規模なファミリーは、モデルの予測の相対的な変化を特定する同じ中心的な問題の変形であると仮定します。このホワイトペーパーでは、MARGINを紹介します。これは、解釈可能性タスクの大規模なセットに対処するためのシンプルでありながら一般的なアプローチです。MARGINは、グラフ信号分析に根ざしたアイデアを活用して、グラフで定義された関数を最大限に説明するノードとして定義される、グラフ内の影響力のあるノードを決定します。タスク固有のグラフと関数を注意深く定義することにより、MARGINが多くの異なる解釈可能性の課題において既存のアプローチよりも優れていることを示します。
Interpretability has emerged as a crucial aspect of building trust in machine learning systems, aimed at providing insights into the working of complex neural networks that are otherwise opaque to a user. There are a plethora of existing solutions addressing various aspects of interpretability ranging from identifying prototypical samples in a dataset to explaining image predictions or explaining mis-classifications. While all of these diverse techniques address seemingly different aspects of interpretability, we hypothesize that a large family of interepretability tasks are variants of the same central problem which is identifying relative change in a model's prediction. This paper introduces MARGIN, a simple yet general approach to address a large set of interpretability tasks MARGIN exploits ideas rooted in graph signal analysis to determine influential nodes in a graph, which are defined as those nodes that maximally describe a function defined on the graph. By carefully defining task-specific graphs and functions, we demonstrate that MARGIN outperforms existing approaches in a number of disparate interpretability challenges.