肺扁平上皮癌(LSCC)は、再発率と転移率が高いです。再発と転移に影響を与える要因は現在不明であり、LSCCの再発と転移のリスクを示す明確な組織病理学的または形態学的特徴はありません。私たちの研究は、H&E染色された組織病理学的全スライド画像(WSI)に基づくLSCCの再発予測に焦点を当てています。利用可能な再発情報を持つ患者の観点からLSCCコホートのサイズが小さいため、このタスクのためのさまざまな畳み込みニューラルネットワークを使用した標準的なエンドツーエンドの学習は過剰適合する傾向があります。また、これらのモデルによって行われた予測は解釈が困難です。組織病理学WSIは通常非常に大きいため、小さなタイルのセットとして処理されます。この作業では、最初にタイルレベルでWSIの表現を学習し、クラスタリングアルゴリズムを活用して、類似した組織病理学的表現を持つタイルを識別する、新しい条件付き自己監視学習(SSL)メソッドを提案します。自己監視から得られた表現とクラスターは、患者レベルでの再発予測のための生存モデルの機能として使用されます。 TCGAとCPTACから公開されている2つのデータセットを使用して、LSCC再発予測生存モデルがLSCC病理学的ステージベースのアプローチと複数インスタンス学習などの機械学習ベースラインの両方よりも優れていることを示します。提案された方法はまた、導出されたクラスターを介して再発の組織病理学的危険因子を説明することを可能にする。これは、病理学者がLSCC再発に関連する形態学的特徴に関する新しい仮説を導き出すのに役立ちます。
Lung squamous cell carcinoma (LSCC) has a high recurrence and metastasis rate. Factors influencing recurrence and metastasis are currently unknown and there are no distinct histopathological or morphological features indicating the risks of recurrence and metastasis in LSCC. Our study focuses on the recurrence prediction of LSCC based on H&E-stained histopathological whole-slide images (WSI). Due to the small size of LSCC cohorts in terms of patients with available recurrence information, standard end-to-end learning with various convolutional neural networks for this task tends to overfit. Also, the predictions made by these models are hard to interpret. Histopathology WSIs are typically very large and are therefore processed as a set of smaller tiles. In this work, we propose a novel conditional self-supervised learning (SSL) method to learn representations of WSI at the tile level first, and leverage clustering algorithms to identify the tiles with similar histopathological representations. The resulting representations and clusters from self-supervision are used as features of a survival model for recurrence prediction at the patient level. Using two publicly available datasets from TCGA and CPTAC, we show that our LSCC recurrence prediction survival model outperforms both LSCC pathological stage-based approach and machine learning baselines such as multiple instance learning. The proposed method also enables us to explain the recurrence histopathological risk factors via the derived clusters. This can help pathologists derive new hypotheses regarding morphological features associated with LSCC recurrence.