決定に最も寄与する入力画像の領域を強調表示することにより、顕著性マップはニューラルネットワークを解釈可能にするための一般的な方法になりました。医用画像では、異常な位置特定のコンテキストでニューラルネットワークを説明するのに特に適しています。ただし、私たちの実験から、それらは、異なるクラスを区別することを可能にする特徴が空間的に相関し、散在し、明らかに自明ではない分類問題にはあまり適していません。したがって、この論文では、より良い解釈可能性のための新しいパラダイムを提案します。この目的のために、私たちはユーザーに関連性があり、簡単に解釈できる情報を提供し、ユーザーが自分の意見を形成できるようにします。潜在表現が解釈不可能な部分と解きほぐされた部分の2つのコンポーネントに分割される解きほぐされた変分オートエンコーダを使用します。後者は、関心のあるさまざまなクラスを明示的に表すカテゴリ変数を説明します。特定の入力サンプルのクラスを提供することに加えて、そのようなモデルは、潜在表現のカテゴリ変数の値を変更することにより、サンプルを特定のクラスから別のクラスのサンプルに変換する可能性を提供します。これにより、クラスの違いをより簡単に解釈できるようになります。法医学における寛骨からの自動性決定のコンテキストで、このアプローチの関連性を説明します。異なるクラスを区別するモデルによってエンコードされた機能は、専門家の知識と一致していることがわかりました。
By highlighting the regions of the input image that contribute the most to the decision, saliency maps have become a popular method to make neural networks interpretable. In medical imaging, they are particularly well-suited to explain neural networks in the context of abnormality localization. However, from our experiments, they are less suited to classification problems where the features that allow to distinguish between the different classes are spatially correlated, scattered and definitely non-trivial. In this paper we thus propose a new paradigm for better interpretability. To this end we provide the user with relevant and easily interpretable information so that he can form his own opinion. We use Disentangled Variational Auto-Encoders which latent representation is divided into two components: the non-interpretable part and the disentangled part. The latter accounts for the categorical variables explicitly representing the different classes of interest. In addition to providing the class of a given input sample, such a model offers the possibility to transform the sample from a given class to a sample of another class, by modifying the value of the categorical variables in the latent representation. This paves the way to easier interpretation of class differences. We illustrate the relevance of this approach in the context of automatic sex determination from hip bones in forensic medicine. The features encoded by the model, that distinguish the different classes were found to be consistent with expert knowledge.