arXiv reaDer
スライド画像全体を分類するためのグラフトランスフォーマー
A graph-transformer for whole slide image classification
ディープラーニングは、スライド画像全体(WSI)分析のための強力なツールです。通常、監視付きディープラーニングを実行する場合、WSIは小さなパッチに分割され、トレーニングされ、結果が集計されて疾患のグレードが推定されます。ただし、パッチベースの方法では、各パッチがWSIと同じラベルで独立していると想定し、疾患の等級付けで重要な全体的なWSIレベルの情報を無視することにより、トレーニング中にラベルノイズが発生します。ここでは、WSIのグラフベースの表現とGTPと呼ばれる病理画像を処理するためのビジョントランスフォーマーを融合して疾患のグレードを予測するグラフトランスフォーマー(GT)を紹介します。臨床プロテオミクス腫瘍分析コンソーシアム(CPTAC)、全国肺スクリーニング試験(NLST)、および癌ゲノムアトラス(TCGA)から4,818のWSIを選択し、GTPを使用して腺癌(LUAD)と扁平上皮癌(LSCC)を区別しました。隣接する非癌性組織(正常)。まず、NLSTデータを使用して、特徴抽出器を生成するための対照的な学習フレームワークを開発しました。これにより、個々のWSIパッチの特徴ベクトルを計算することができました。これは、グラフのノードを表すために使用され、その後GTPフレームワークが構築されました。 CPTACデータでトレーニングされたモデルは、5分割交差検定に基づく3ラベル分類(通常対LUAD対LSCC:平均精度= 91.2±2.5%)で一貫して高いパフォーマンスを達成し、外部での平均精度= 82.3±1.0%を達成しましたテストデータ(TCGA)。また、グラフCAMと呼ばれるグラフベースの顕著性マッピング手法を導入しました。これにより、クラスラベルとの関連性が高い領域を識別できます。私たちの調査結果は、GTPがWSIレベルの分類のための解釈可能で効果的な深層学習フレームワークであることを示しています。
Deep learning is a powerful tool for whole slide image (WSI) analysis. Typically, when performing supervised deep learning, a WSI is divided into small patches, trained and the outcomes are aggregated to estimate disease grade. However, patch-based methods introduce label noise during training by assuming that each patch is independent with the same label as the WSI and neglect overall WSI-level information that is significant in disease grading. Here we present a Graph-Transformer (GT) that fuses a graph-based representation of an WSI and a vision transformer for processing pathology images, called GTP, to predict disease grade. We selected 4,818 WSIs from the Clinical Proteomic Tumor Analysis Consortium (CPTAC), the National Lung Screening Trial (NLST), and The Cancer Genome Atlas (TCGA), and used GTP to distinguish adenocarcinoma (LUAD) and squamous cell carcinoma (LSCC) from adjacent non-cancerous tissue (normal). First, using NLST data, we developed a contrastive learning framework to generate a feature extractor. This allowed us to compute feature vectors of individual WSI patches, which were used to represent the nodes of the graph followed by construction of the GTP framework. Our model trained on the CPTAC data achieved consistently high performance on three-label classification (normal versus LUAD versus LSCC: mean accuracy= 91.2 ± 2.5%) based on five-fold cross-validation, and mean accuracy = 82.3 ± 1.0% on external test data (TCGA). We also introduced a graph-based saliency mapping technique, called GraphCAM, that can identify regions that are highly associated with the class label. Our findings demonstrate GTP as an interpretable and effective deep learning framework for WSI-level classification.
updated: Thu May 19 2022 16:32:10 GMT+0000 (UTC)
published: Thu May 19 2022 16:32:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト