arXiv reaDer
説明方法を使用した組織病理画像の深層学習ベースの分析における課題の解決
Resolving challenges in deep learning-based analyses of histopathological images using explanation methods
 深層学習は、その高い予測品質により、最近デジタル病理学で人気を博しています。ただし、医療分野では、標準的な定量的性能評価を超えて理解を深めるために、説明と洞察が必要です。最近では説明法が登場し、今のところ医学ではほとんど使用されていません。この作品は、ディープラーニングベースのデジタル組織病理学分析で遭遇する一般的な課題を解決できるヒートマップを生成するためのアプリケーションを示しています。これらの課題には、通常、組織病理学データに固有のバイアスが含まれます。さまざまな腫瘍エンティティの公に利用可能なヘマトキシリンとエオシンスライドでの腫瘍組織識別のバイナリ分類タスクを研究し、3種類のバイアスを調査します。(1)全体のデータセットに影響を与えるバイアス(3)サンプリングバイアス。標準分析はパッチレベルの評価に焦点を当てていますが、ピクセル単位のヒートマップを提唱しています。これは、より正確で多用途の診断機器を提供し、さらにデータの偏りを明らかにするのに役立ちます。この洞察は、検出だけでなく、一般的な隠れたバイアスの影響を取り除くのにも役立ち、データセット内およびデータセット全体の一般化を改善します。たとえば、ラベリングバイアスを減らすと、レシーバーの動作特性曲線の下の領域が5%改善される傾向が見られます。したがって、説明技法は、デジタル病理学における実際のアプリケーションのライフサイクル内の開発および展開フェーズに役立つ、非常に関連性の高いツールであることが示されています。
Deep learning has recently gained popularity in digital pathology due to its high prediction quality. However, the medical domain requires explanation and insight for a better understanding beyond standard quantitative performance evaluation. Recently, explanation methods have emerged, which are so far still rarely used in medicine. This work shows their application to generate heatmaps that allow to resolve common challenges encountered in deep learning-based digital histopathology analyses. These challenges comprise biases typically inherent to histopathology data. We study binary classification tasks of tumor tissue discrimination in publicly available haematoxylin and eosin slides of various tumor entities and investigate three types of biases: (1) biases which affect the entire dataset, (2) biases which are by chance correlated with class labels and (3) sampling biases. While standard analyses focus on patch-level evaluation, we advocate pixel-wise heatmaps, which offer a more precise and versatile diagnostic instrument and furthermore help to reveal biases in the data. This insight is shown to not only detect but also to be helpful to remove the effects of common hidden biases, which improves generalization within and across datasets. For example, we could see a trend of improved area under the receiver operating characteristic curve by 5% when reducing a labeling bias. Explanation techniques are thus demonstrated to be a helpful and highly relevant tool for the development and the deployment phases within the life cycle of real-world applications in digital pathology.
updated: Fri Apr 24 2020 15:13:00 GMT+0000 (UTC)
published: Thu Aug 15 2019 15:46:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト