Iterative augmentation of visual evidence for weakly-supervised lesion localization in deep interpretability frameworks
  ディープラーニング(DL)システムの解釈可能性は、得られた予測に対する専門家の信頼を高め、臨床設定への統合を促進するために、医療画像で注目を集めています。視覚的証拠増強を用いた医療画像のDL分類タスクの解釈可能性を生成するために、深い可視化手法を提案します。提案された方法は、画像レベルのラベルのみで訓練された分類器の予測に基づいて異常を繰り返し明らかにします。各画像について、予測の最初の視覚的証拠が、与えられた視覚的帰属手法で抽出されます。これにより、異常のローカライズが可能になり、選択的な修復によって除去されます。システムが画像を通常と見なすまで、この手順を繰り返し適用します。これにより、最初は検出されなかったが最終診断のために考慮されるべき識別性の低い病変を含む、視覚的証拠が増大します。カラー眼底画像の2つの網膜疾患の等級分けにメソッドを適用します:糖尿病性網膜症(DR)と加齢黄斑変性(AMD)。生成された視覚的証拠と、さまざまな種類のDRおよびAMD異常の弱監視ローカリゼーションのパフォーマンスを定性的および定量的に評価します。予測の増強された視覚的証拠は、診断のために専門家によって検討されたバイオマーカーを強調し、最終的なローカリゼーションパフォーマンスを改善することを示します。異なる分類タスク、視覚的帰属手法、およびネットワークアーキテクチャに適用した場合、平均10個の誤検出ごとの平均感度に関して、画像ごとに11.2 $ \ pm $ 2.0%の相対的な増加になります。これにより、提案された方法は、医療画像におけるDL分類器の網羅的な視覚サポートのための有用なツールとなります。
Interpretability of deep learning (DL) systems is gaining attention in medical imaging to increase experts' trust in the obtained predictions and facilitate their integration in clinical settings. We propose a deep visualization method to generate interpretability of DL classification tasks in medical imaging by means of visual evidence augmentation. The proposed method iteratively unveils abnormalities based on the prediction of a classifier trained only with image-level labels. For each image, initial visual evidence of the prediction is extracted with a given visual attribution technique. This provides localization of abnormalities that are then removed through selective inpainting. We iteratively apply this procedure until the system considers the image as normal. This yields augmented visual evidence, including less discriminative lesions which were not detected at first but should be considered for final diagnosis. We apply the method to grading of two retinal diseases in color fundus images: diabetic retinopathy (DR) and age-related macular degeneration (AMD). We evaluate the generated visual evidence and the performance of weakly-supervised localization of different types of DR and AMD abnormalities, both qualitatively and quantitatively. We show that the augmented visual evidence of the predictions highlights the biomarkers considered by the experts for diagnosis and improves the final localization performance. It results in a relative increase of 11.2$\pm$2.0% per image regarding average sensitivity per average 10 false positives, when applied to different classification tasks, visual attribution techniques and network architectures. This makes the proposed method a useful tool for exhaustive visual support of DL classifiers in medical imaging.
updated: Wed Oct 16 2019 14:30:47 GMT+0000 (UTC)
published: Wed Oct 16 2019 14:30:47 GMT+0000 (UTC)
