Weakly Supervised Instance Learning for Thyroid Malignancy Prediction from Whole Slide Cytopathology Images
細胞病理学全体スライド画像(WSI)からの機械学習ベースの甲状腺悪性腫瘍予測を検討します。複数インスタンス学習(MIL)アプローチは、通常WSIの分析に使用され、画像(バッグ)をパッチ(インスタンス)に分割します。パッチ(インスタンス)は、単一のバッグレベルのラベルを予測するために使用されます。これらのアプローチは、ユニークなバッグ構造のため、細胞病理学スライドでは不十分に機能します。複数のタイプのラベルを検討することにより、これらの課題に対処します。バッグレベルの悪性度と順序付けられた診断スコア、インスタンスレベルの情報と異常ラベルです。最尤推定(MLE)フレームワークを提案することにより、MIL設定を超えてそれらの貢献を研究し、そこから2段階の深層学習ベースのアルゴリズムを導出します。アルゴリズムは有益なインスタンスを識別し、グローバルな悪性予測に組み込まれるローカルな悪性スコアを割り当てます。 MLEの下限を導出し、統計的分析を通じて動機付けされる、弱い監視に基づく改善されたトレーニング戦略を導きます。下限により、提案されたアルゴリズムを拡張して、ニューラルネットワークの単一の出力から複数のバッグおよびインスタンスレベルのラベルを同時に予測できます。実験結果は、提案されたアルゴリズムがいくつかの競合する方法と比較して競争力のあるパフォーマンスを提供し、(専門家の)人間レベルのパフォーマンスを達成し、人間の意思決定の増大を可能にすることを示しています。
We consider machine-learning-based thyroid-malignancy prediction from cytopathology whole-slide images (WSI). Multiple instance learning (MIL) approaches, typically used for the analysis of WSIs, divide the image (bag) into patches (instances), which are used to predict a single bag-level label. These approaches perform poorly in cytopathology slides due to a unique bag structure: sparsely located informative instances with varying characteristics of abnormality. We address these challenges by considering multiple types of labels: bag-level malignancy and ordered diagnostic scores, as well as instance-level informativeness and abnormality labels. We study their contribution beyond the MIL setting by proposing a maximum likelihood estimation (MLE) framework, from which we derive a two-stage deep-learning-based algorithm. The algorithm identifies informative instances and assigns them local malignancy scores that are incorporated into a global malignancy prediction. We derive a lower bound of the MLE, leading to an improved training strategy based on weak supervision, that we motivate through statistical analysis. The lower bound further allows us to extend the proposed algorithm to simultaneously predict multiple bag and instance-level labels from a single output of a neural network. Experimental results demonstrate that the proposed algorithm provides competitive performance compared to several competing methods, achieves (expert) human-level performance, and allows augmentation of human decisions.
updated: Thu Jul 30 2020 20:31:50 GMT+0000 (UTC)
published: Fri Apr 26 2019 03:03:20 GMT+0000 (UTC)
