arXiv reaDer
REFUGE Challenge:眼底写真からの緑内障評価の自動化方法を評価するための統一されたフレームワーク
REFUGE Challenge: A Unified Framework for Evaluating Automated Methods for Glaucoma Assessment from Fundus Photographs
  緑内障は、労働年齢人口における不可逆的だが予防可能な失明の主な原因の1つです。カラー眼底写真(CFP)は、網膜障害をスクリーニングするための最も費用対効果の高い画像診断法です。ただし、緑内障への適用は、垂直カップ/ディスク比などのいくつかの関連バイオマーカーの計算に限定されています。ディープラーニングアプローチは、医療画像分析に広く適用されていますが、利用可能なデータセットのサイズが限られているため、緑内障の評価に広く使用されていません。さらに、標準化されたベンチマーク戦略がないため、既存の方法を均一に比較することは困難です。これらの問題を克服するために、MICCAI 2018に関連して開催された網膜眼底緑内障チャレンジ、REFUGE(\ url {https://refuge.grand-challenge.org)をセットアップしました。ディスク/カップのセグメンテーションと緑内障の分類。 REFUGEの一環として、現在最大の既存のものであるグラウンドトゥルースセグメンテーションと臨床緑内障ラベルを含む1200個の眼底画像のデータセットを公開しました。また、さまざまなモデルの比較を容易にし、公平性を確保するための評価フレームワークを構築し、この分野での新しい技術の開発を促進しています。 12チームが資格を取得し、オンラインチャレンジに参加しました。このホワイトペーパーでは、それらの方法をまとめ、対応する結果を分析します。特に、緑内障の分類作業において、上位2チームが2人の人間の専門家よりも優れていることを確認しました。さらに、セグメンテーションの結果は、一般にグラウンドトゥルースアノテーションと一致しており、結果を組み合わせることでさらに活用できる補完的な結果が得られました。
Glaucoma is one of the leading causes of irreversible but preventable blindness in working age populations. Color fundus photography (CFP) is the most cost-effective imaging modality to screen for retinal disorders. However, its application to glaucoma has been limited to the computation of a few related biomarkers such as the vertical cup-to-disc ratio. Deep learning approaches, although widely applied for medical image analysis, have not been extensively used for glaucoma assessment due to the limited size of the available data sets. Furthermore, the lack of a standardize benchmark strategy makes difficult to compare existing methods in a uniform way. In order to overcome these issues we set up the Retinal Fundus Glaucoma Challenge, REFUGE (\url{https://refuge.grand-challenge.org), held in conjunction with MICCAI 2018. The challenge consisted of two primary tasks, namely optic disc/cup segmentation and glaucoma classification. As part of REFUGE, we have publicly released a data set of 1200 fundus images with ground truth segmentations and clinical glaucoma labels, currently the largest existing one. We have also built an evaluation framework to ease and ensure fairness in the comparison of different models, encouraging the development of novel techniques in the field. 12 teams qualified and participated in the online challenge. This paper summarizes their methods and analyzes their corresponding results. In particular, we observed that two of the top-ranked teams outperformed two human experts in the glaucoma classification task. Furthermore, the segmentation results were in general consistent with the ground truth annotations, with complementary outcomes that can be further exploited by ensembling the results.
updated: Tue Oct 08 2019 20:20:43 GMT+0000 (UTC)
published: Tue Oct 08 2019 20:20:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト