arXiv reaDer
DR | GRADUATE:眼底画像における不確実性を意識した深層学習ベースの糖尿病性網膜症のグレーディング
DR|GRADUATE: uncertainty-aware deep learning-based diabetic retinopathy grading in eye fundus images
 糖尿病性網膜症(DR)の等級付けは、適切な治療と患者のフォローアップを決定する上で重要ですが、スクリーニングプロセスは面倒でエラーが発生しやすくなります。ディープラーニングアプローチは、コンピューター支援診断(CAD)システムとして有望なパフォーマンスを示していますが、そのブラックボックスの動作が臨床アプリケーションを妨げています。私たちはDR | GRADUATEを提案します。DR| GRADUATEは、医学的に解釈可能な説明と予測の不確かさの見積もりを提供することでその決定をサポートし、眼科医がその決定をどれだけ信頼すべきか測定できるようにする、新しい深層学習ベースのDRグレーディングCADシステムです。 DR | GRADUATEは、DRグレーディング問題の通常の性質を考慮して設計しました。複数インスタンス学習フレームワークに基づいて構築された斬新なガウシアンサンプリングアプローチにより、DR | GRADUATEは、画像ごとのラベルのみでトレーニングされながら、説明マップと予測の不確実性に関連する画像グレードを推測できます。 DR | GRADUATEはKaggleトレーニングセットでトレーニングされ、複数のデータセットにわたって評価されました。 DRグレーディングでは、5つの異なるデータセットで0.71〜0.84の2次加重コーエンカッパ(QWK)が達成されました。予測の不確実性が低い画像で高いQWK値が発生することを示し、この不確実性が予測の品質の有効な尺度であることを示します。さらに、品質の悪い画像は一般に不確実性が高く、診断に適さない画像が実際には信頼性の低い予測につながることを示しています。さらに、馴染みのない医療画像データタイプのテストでは、DR | GRADUATEで異常値の検出が可能であることが示されています。アテンションマップは通常、診断の対象となる領域を強調表示します。これらの結果は、DR重大度評価におけるセカンドオピニオンシステムとしてのDR | GRADUATEの大きな可能性を示しています。
Diabetic retinopathy (DR) grading is crucial in determining the adequate treatment and follow up of patients, but the screening process can be tiresome and prone to errors. Deep learning approaches have shown promising performance as computer-aided diagnosis(CAD) systems, but their black-box behaviour hinders the clinical application. We propose DR|GRADUATE, a novel deep learning-based DR grading CAD system that supports its decision by providing a medically interpretable explanation and an estimation of how uncertain that prediction is, allowing the ophthalmologist to measure how much that decision should be trusted. We designed DR|GRADUATE taking into account the ordinal nature of the DR grading problem. A novel Gaussian-sampling approach built upon a Multiple Instance Learning framework allow DR|GRADUATE to infer an image grade associated with an explanation map and a prediction uncertainty while being trained only with image-wise labels. DR|GRADUATE was trained on the Kaggle training set and evaluated across multiple datasets. In DR grading, a quadratic-weighted Cohen's kappa (QWK) between 0.71 and 0.84 was achieved in five different datasets. We show that high QWK values occur for images with low prediction uncertainty, thus indicating that this uncertainty is a valid measure of the predictions' quality. Further, bad quality images are generally associated with higher uncertainties, showing that images not suitable for diagnosis indeed lead to less trustworthy predictions. Additionally, tests on unfamiliar medical image data types suggest that DR|GRADUATE allows outlier detection. The attention maps generally highlight regions of interest for diagnosis. These results show the great potential of DR|GRADUATE as a second-opinion system in DR severity grading.
updated: Fri May 29 2020 14:55:20 GMT+0000 (UTC)
published: Fri Oct 25 2019 14:56:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト