arXiv reaDer
hist2RNA: 乳がんの組織病理画像から遺伝子発現を予測するための効率的なディープラーニング アーキテクチャ
hist2RNA: An efficient deep learning architecture to predict gene expression from breast cancer histopathology images
遺伝子発現は、通常の免疫組織化学 (IHC) を使用して得られるよりも、再発リスクの予測と治療反応性を改善して、乳癌のサブタイプに使用できます。ただし、診療所では、分子プロファイリングは主に ER+ がんに使用され、費用がかかり、組織を破壊し、特殊なプラットフォームが必要で、結果を得るまでに数週間かかります。深層学習アルゴリズムは、デジタル組織病理学画像の形態学的パターンを効果的に抽出して、分子表現型を迅速かつ費用対効果の高い方法で予測できます。ヘマトキシリンおよびエオシン (H&E) 染色されたスライド全体から、管腔 PAM50 サブタイプを含む 138 の遺伝子 (6 つの市販の分子プロファイリング テストから組み込まれている) の発現を予測するために、バルク RNA シーケンス技術に触発された hist2RNA と呼ばれる、計算効率の高い新しいアプローチを提案します。イメージ (WSI)。トレーニング フェーズでは、事前トレーニング済みモデルから抽出された各患者の特徴を集約し、The Cancer Genome Atlas (TCGA、n=335) の注釈付き H&E 画像を使用して患者レベルで遺伝子発現を予測します。ホールドアウト テスト セット (n = 160、患者全体の相関 = 0.82、遺伝子全体の相関 = 0.29) で成功した遺伝子予測を示し、既知の IHC を使用して外部組織マイクロアレイ (TMA) データセット (n = 498) で探索的分析を実行します。そして生存情報。私たちのモデルは、TMA データセットの遺伝子発現と管腔 PAM50 サブタイプ (Luminal A 対 Luminal B) を予測することができ、単変量解析 (c-index = 0.56、ハザード比 = 2.16、p<0.005) で全生存率の予後的意義を示します。標準的な臨床病理学的変数を組み込んだ多変量解析における独立した有意性 (c-index = 0.65、ハザード比 = 1.85、p<0.005)。
Gene expression can be used to subtype breast cancer with improved prediction of risk of recurrence and treatment responsiveness over that obtained using routine immunohistochemistry (IHC). However, in the clinic, molecular profiling is primarily used for ER+ cancer and is costly and tissue destructive, requires specialized platforms and takes several weeks to obtain a result. Deep learning algorithms can effectively extract morphological patterns in digital histopathology images to predict molecular phenotypes quickly and cost-effectively. We propose a new, computationally efficient approach called hist2RNA inspired by bulk RNA-sequencing techniques to predict the expression of 138 genes (incorporated from six commercially available molecular profiling tests), including luminal PAM50 subtype, from hematoxylin and eosin (H&E) stained whole slide images (WSIs). The training phase involves the aggregation of extracted features for each patient from a pretrained model to predict gene expression at the patient level using annotated H&E images from The Cancer Genome Atlas (TCGA, n=335). We demonstrate successful gene prediction on a held-out test set (n=160, corr=0.82 across patients, corr=0.29 across genes) and perform exploratory analysis on an external tissue microarray (TMA) dataset (n=498) with known IHC and survival information. Our model is able to predict gene expression and luminal PAM50 subtype (Luminal A versus Luminal B) on the TMA dataset with prognostic significance for overall survival in univariate analysis (c-index=0.56, hazard ratio=2.16, p<0.005), and independent significance in multivariate analysis incorporating standard clinicopathological variables (c-index=0.65, hazard ratio=1.85, p<0.005).
updated: Mon Apr 10 2023 10:54:32 GMT+0000 (UTC)
published: Mon Apr 10 2023 10:54:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト