畳み込みニューラルネットワークは、複数インスタンス学習(MIL)を使用した弱い注釈を使用して組織学スライド分類を実行するようにトレーニングできます。ただし、ラベル付き組織学データが不足しているため、MILを直接適用するとオーバーフィッティングが発生しやすくなり、監視信号が弱いため、ネットワークは豊富な機能表現を学習できません。コントラスト予測コーディング(CPC)によるデータ効率の高い自己監視機能学習のパワーと、正則化された注意に基づくMILの解釈可能性と柔軟性を組み合わせた2段階の半監視アプローチで、このような制限を克服することを提案します。 2段階のCPC + MIL半教師付きパイプラインを、乳がんの組織像のバイナリ分類に適用します。 5つのランダムな分割にわたって、95%の平均検証精度と0.968のROC曲線の下の領域で最先端のパフォーマンスを報告します。さらに、単純な転送学習と比較してCPCを介して学習した機能の品質を評価し、CPC機能を使用した強力な分類パフォーマンスが、機能エンコーダがフリーズされていてもMILフレームワークで効率的に活用できることを示します。
Convolutional neural networks can be trained to perform histology slide classification using weak annotations with multiple instance learning (MIL). However, given the paucity of labeled histology data, direct application of MIL can easily suffer from overfitting and the network is unable to learn rich feature representations due to the weak supervisory signal. We propose to overcome such limitations with a two-stage semi-supervised approach that combines the power of data-efficient self-supervised feature learning via contrastive predictive coding (CPC) and the interpretability and flexibility of regularized attention-based MIL. We apply our two-stage CPC + MIL semi-supervised pipeline to the binary classification of breast cancer histology images. Across five random splits, we report state-of-the-art performance with a mean validation accuracy of 95% and an area under the ROC curve of 0.968. We further evaluate the quality of features learned via CPC relative to simple transfer learning and show that strong classification performance using CPC features can be efficiently leveraged under the MIL framework even with the feature encoder frozen.