アトリビューションメソッドは、機械学習モデルを調査および検証するための使いやすいツールです。文献には複数の方法が提案されており、どの方法が特定のタスクに最も適しているかはまだ明確ではありません。この研究では、アルツハイマー病の分類のタスクについて、4つの属性法、すなわち、勾配*入力、誘導逆伝播、層ごとの関連性伝播および閉塞の堅牢性をテストしました。アルツハイマー病患者と健常対照者の構造MRIデータを分離するために、同一のトレーニング設定で畳み込みニューラルネットワーク(CNN)を繰り返しトレーニングしました。その後、テストデータの各被験者の属性マップを作成し、モデルおよび属性メソッド間でそれらを定量的に比較しました。視覚的な比較だけでは不十分であり、広く使用されている帰属方法の中には、一貫性のない結果が生じるものがあることを示しています。
Attribution methods are an easy to use tool for investigating and validating machine learning models. Multiple methods have been suggested in the literature and it is not yet clear which method is most suitable for a given task. In this study, we tested the robustness of four attribution methods, namely gradient*input, guided backpropagation, layer-wise relevance propagation and occlusion, for the task of Alzheimer's disease classification. We have repeatedly trained a convolutional neural network (CNN) with identical training settings in order to separate structural MRI data of patients with Alzheimer's disease and healthy controls. Afterwards, we produced attribution maps for each subject in the test data and quantitatively compared them across models and attribution methods. We show that visual comparison is not sufficient and that some widely used attribution methods produce highly inconsistent outcomes.