arXiv reaDer
ルート、解釈、繰り返し: 事後の説明可能性と解釈可能なモデルの間の境界線があいまいになる
Route, Interpret, Repeat: Blurring the line between post hoc explainability and interpretable models
ML モデル設計に対する現在のアプローチは、柔軟なブラックボックス モデルを選択して事後的に説明するか、解釈可能なモデルから始めるかのいずれかです。ブラックボックス モデルは柔軟ですが説明が難しいのに対し、解釈可能なモデルは説明できるように設計されています。ただし、解釈可能なモデルの開発には広範な ML の知識が必要であり、結果として得られるモデルは柔軟性が低くなる傾向があり、Blackbox の同等モデルと比較してパフォーマンスが劣る可能性があります。この論文は、BlackBox の事後説明と解釈可能なモデルの構築との区別を曖昧にすることを目的としています。私たちは、柔軟な BlackBox モデルから始めて、解釈可能なモデルと残差ネットワークの混合物を徐々に切り出すことを提案します。私たちの設計はサンプルのサブセットを識別し、解釈可能なモデルを通じてそれらをルーティングします。残りのサンプルは、柔軟な残留ネットワークを通じてルーティングされます。解釈可能なモデルのバックボーンとして一次ロジック (FOL) を採用し、BlackBox モデルから取得した概念に基本的な推論を提供します。残差ネットワークでは、残差ネットワークによって説明されるデータの割合が望ましいしきい値を下回るまでこの方法を繰り返します。私たちのアプローチにはいくつかの利点があります。まず、解釈可能で柔軟な残差ネットワークを組み合わせることで、パフォーマンスにほとんど妥協が生じません。第 2 に、ルート、解釈、繰り返しのアプローチにより、非常に柔軟な解釈可能なモデルが得られます。私たちの広範な実験により、さまざまなデータセットでのモデルのパフォーマンスが実証されています。 FOL モデルを編集することで、元の BlackBox モデルによって学習されたショートカットを修正できることを示します。最後に、私たちの方法は、トレーニングが簡単で多くのアプリケーションに適応できる、ハイブリッド シンボリック コネクショニスト ネットワークのフレームワークを提供します。
The current approach to ML model design is either to choose a flexible Blackbox model and explain it post hoc or to start with an interpretable model. Blackbox models are flexible but difficult to explain, whereas interpretable models are designed to be explainable. However, developing interpretable models necessitates extensive ML knowledge, and the resulting models tend to be less flexible, offering potentially subpar performance compared to their Blackbox equivalents. This paper aims to blur the distinction between a post hoc explanation of a BlackBox and constructing interpretable models. We propose beginning with a flexible BlackBox model and gradually carving out a mixture of interpretable models and a residual network. Our design identifies a subset of samples and routes them through the interpretable models. The remaining samples are routed through a flexible residual network. We adopt First Order Logic (FOL) as the interpretable model's backbone, which provides basic reasoning on concepts retrieved from the BlackBox model. On the residual network, we repeat the method until the proportion of data explained by the residual network falls below a desired threshold. Our approach offers several advantages. First, the mixture of interpretable and flexible residual networks results in almost no compromise in performance. Second, the route, interpret, and repeat approach yields a highly flexible interpretable model. Our extensive experiment demonstrates the performance of the model on various datasets. We show that by editing the FOL model, we can fix the shortcut learned by the original BlackBox model. Finally, our method provides a framework for a hybrid symbolic-connectionist network that is simple to train and adaptable to many applications.
updated: Fri Jul 07 2023 01:10:18 GMT+0000 (UTC)
published: Fri Jul 07 2023 01:10:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト