Deep learning algorithms out-perform veterinary pathologists in detecting the mitotically most active tumor region
有糸分裂活性が最も高い腫瘍領域で決定される有糸分裂像の手動カウントは、ほとんどの腫瘍等級付けスキームの重要なパラメーターです。ただし、腫瘍切片の有糸分裂像の分布が不均一であるため、領域の選択に強く依存する可能性があります。領域の選択が、評価者間の不一致が高いことが知られている有糸分裂数にどの程度影響するかという質問を評価することを目的としました。 。有糸分裂像について完全に注釈が付けられた、H&E染色された犬の皮膚肥満細胞腫の32枚のスライド画像全体のデータセットで、8人の獣医病理学者(5人の理事会認定、3人はトレーニング中)に有糸分裂数の対象分野を選択するよう依頼しました。有糸分裂数の潜在的な違いを評価するために、選択した領域の有糸分裂数をスライド上の全体的な分布と比較しました。さらに、最高の有糸分裂密度を評価するための3つのディープラーニングベースの方法を評価しました。モデルは、回帰タスクとして、提示された画像パッチの有糸分裂数を直接予測しようとします。 2番目の方法は、有糸分裂像のセグメンテーションマスクを導出することを目的としており、これを使用して有糸分裂密度を取得します。最後に、最先端のアーキテクチャに基づいて2段階のオブジェクト検出パイプラインを評価し、個々の有糸分裂像を特定しました。すべてのモデルによる予測は、平均して専門家の予測よりも優れていることがわかりました。 2ステージのオブジェクト検出器は、ほとんどの腫瘍症例で最高のパフォーマンスを発揮し、ほとんどの人間の病理学者を上回りました。予測された有糸分裂数とグラウンドトゥルースの有糸分裂数の間の相関も、このアプローチに最適でした(0.963から0.979)。さらに、病理学者間で位置選択にかなりの違いがあることがわかりました。これは、手動の有糸分裂数で報告されている高い変動を部分的に説明できます。
Manual count of mitotic figures, which is determined in the tumor region with the highest mitotic activity, is a key parameter of most tumor grading schemes. It can be, however, strongly dependent on the area selection due to uneven mitotic figure distribution in the tumor section.We aimed to assess the question, how significantly the area selection could impact the mitotic count, which has a known high inter-rater disagreement. On a data set of 32 whole slide images of H&E-stained canine cutaneous mast cell tumor, fully annotated for mitotic figures, we asked eight veterinary pathologists (five board-certified, three in training) to select a field of interest for the mitotic count. To assess the potential difference on the mitotic count, we compared the mitotic count of the selected regions to the overall distribution on the slide.Additionally, we evaluated three deep learning-based methods for the assessment of highest mitotic density: In one approach, the model would directly try to predict the mitotic count for the presented image patches as a regression task. The second method aims at deriving a segmentation mask for mitotic figures, which is then used to obtain a mitotic density. Finally, we evaluated a two-stage object-detection pipeline based on state-of-the-art architectures to identify individual mitotic figures. We found that the predictions by all models were, on average, better than those of the experts. The two-stage object detector performed best and outperformed most of the human pathologists on the majority of tumor cases. The correlation between the predicted and the ground truth mitotic count was also best for this approach (0.963 to 0.979). Further, we found considerable differences in position selection between pathologists, which could partially explain the high variance that has been reported for the manual mitotic count.
updated: Wed Oct 21 2020 05:49:22 GMT+0000 (UTC)
published: Tue Feb 12 2019 17:37:20 GMT+0000 (UTC)
