arXiv reaDer
バイナリ医用画像分類のための決定理論的方法でのモデルの自己解釈可能性の再検討
Revisiting model self-interpretability in a decision-theoretic way for binary medical image classification
ディープ ニューラル ネットワーク ベースの分類器には、特に医療画像処理における重要な決定に対処する場合に、解釈可能性が強く望まれます。一般的に使用される事後的な解釈可能性の方法は、常に有用であるとは限りません。そのような方法が異なると、特定のモデルについてもっともらしいが異なる解釈がいくつか生成される可能性があり、どれを選択するかについて混乱を招く可能性があるためです。 {この作業では、単一層の完全に接続された単一の重みを持つネットワークと結合された、本質的に解釈可能なエンコーダー/デコーダー モデルが、バイナリ医療画像分類問題に対して提案されています。同じタスクのトレーニング済みブラック ボックス ネットワークの特徴抽出コンポーネントは、解釈可能なモデルの事前トレーニング済みエンコーダーとして使用されます。モデルは、同様の精度を維持するために、指定されたトレーニング済みブラック ボックス ディープ バイナリ分類器の決定統計を推定するようにトレーニングされます。元の分類器と同じ決定統計値を生成します。これは、トレーニング中にブラック ボックス モデルとエンコーダー/デコーダー ベースのモデルの決定統計値の間の平均二乗誤差を最小化することによって達成されます。デコーダ出力イメージは、等価マップと呼ばれます。単層ネットワークは完全に解釈可能であるため、等価マップは、決定統計値に寄与する変換された画像特徴の視覚化を提供し、さらに、それらの相対的な寄与の定量化を可能にします。従来の事後解釈可能性メソッドとは異なり、提案されたメソッドは本質的に解釈可能で、定量的であり、基本的に決定理論に基づいています。
Interpretability is highly desired for deep neural network-based classifiers, especially when addressing high-stake decisions in medical imaging. Commonly used post-hoc interpretability methods may not be always useful because different such methods can produce several plausible but different interpretations of a given model, leading to confusion about which one to choose. {In this work, an inherently interpretable encoder-decoder model coupled with a single-layer fully connected network with unity weights is proposed for binary medical image classification problems. The feature extraction component of a trained black-box network for the same task is employed as the pre-trained encoder of the interpretable model. The model is trained to estimate the decision statistic of the given trained black-box deep binary classifier to maintain a similar accuracy.} The decoder output represents a transformed version of the to-be-classified image that, when processed by the fixed fully connected layer, produces the same decision statistic value as the original classifier. This is accomplished by minimizing the mean squared error between the decision statistic values of the black-box model and encoder-decoder based model during training. The decoder output image is referred to as an equivalency map. Because the single-layer network is fully interpretable, the equivalency map provides a visualization of the transformed image features that contribute to the decision statistic value and, moreover, permits quantification of their relative contributions. Unlike the traditional post-hoc interpretability methods, the proposed method is inherently interpretable, quantitative, and fundamentally based on decision theory.
updated: Mon Mar 13 2023 05:51:35 GMT+0000 (UTC)
published: Mon Mar 13 2023 05:51:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト