病理組織学スライドの分析は、多くの診断、特にゴールドスタンダードを定義する腫瘍学にとって重要なステップです。デジタル病理組織学的分析の場合、高度な訓練を受けた病理学者は、細胞の異常な領域、または場合によっては単一の細胞を見つけるために、複数のズームレベルにわたって極端なデジタル解像度(100,000 ^ 2ピクセル)の膨大なスライド全体の画像を確認する必要があります何百万もの。この問題への深層学習の適用は、典型的なデータセットには数百のサンプルしか含まれていないため、サンプルサイズが小さいだけでなく、解釈可能な分類およびセグメンテーションモデルをトレーニングするための地上真実のローカライズされた注釈の生成によっても妨げられています。トレーニング中に画像レベルのラベルのみが利用可能な、弱教師付き学習のコンテキストで疾患の位置を特定する方法を提案します。ピクセルレベルのアノテーションがなくても、Camelyon-16リンパ節転移の検出に関する強力なアノテーションでトレーニングされたモデルに匹敵するパフォーマンスを発揮できます。これは、事前トレーニング済みの深い畳み込みネットワーク、機能の埋め込み、およびセマンティックセグメンテーションとオブジェクト検出の分野からの複数インスタンス学習手法であるトップインスタンスとネガティブエビデンスを介した学習によって実現します。
Analysis of histopathology slides is a critical step for many diagnoses, and in particular in oncology where it defines the gold standard. In the case of digital histopathological analysis, highly trained pathologists must review vast whole-slide-images of extreme digital resolution (100,000^2 pixels) across multiple zoom levels in order to locate abnormal regions of cells, or in some cases single cells, out of millions. The application of deep learning to this problem is hampered not only by small sample sizes, as typical datasets contain only a few hundred samples, but also by the generation of ground-truth localized annotations for training interpretable classification and segmentation models. We propose a method for disease localization in the context of weakly supervised learning, where only image-level labels are available during training. Even without pixel-level annotations, we are able to demonstrate performance comparable with models trained with strong annotations on the Camelyon-16 lymph node metastases detection challenge. We accomplish this through the use of pre-trained deep convolutional networks, feature embedding, as well as learning via top instances and negative evidence, a multiple instance learning technique from the field of semantic segmentation and object detection.