arXiv reaDer
共発現ベースの畳み込みニューラルネットワークを使用した組織病理学画像からの前立腺癌遺伝子発現のトランスクリプトーム全体の予測
Transcriptome-wide prediction of prostate cancer gene expression from histopathology images using co-expression based convolutional neural networks
遺伝子発現プロファイリングによる分子表現型分析は、現代の癌研究や分子診断において一般的です。ただし、分子プロファイリングは、実装にコストとリソースを大量に消費するままであり、臨床診断に導入され始めたばかりです。腫瘍で発生する遺伝子変化や遺伝子発現変化などの分子変化は、組織の形態学的変化を引き起こし、顕微鏡レベルで観察することができます。形態学的パターンといくつかの分子表現型との関係を利用して、深い畳み込みニューラルネットワーク(CNN)を使用して、ルーチンのヘマトキシリンおよびエオシン(H&E)染色された全スライド画像(WSI)から直接分子表現型を予測できます。この研究では、形態と遺伝子発現の関係の疾患特異的モデリングのための新しい計算効率の高いアプローチを提案し、CNNを使用してH&EのWSIからバルクRNAシーケンス推定値を予測する前立腺癌の最初のトランスクリプトーム全体の分析を実施しました染色された組織。この研究はTCGAPRAD研究に基づいており、370人の患者のWSIとRNA-seqデータの両方が含まれています。 15586のタンパク質コーディングと十分に頻繁に発現する転写産物のうち、6618は、交差検定でRNA-seq推定値(FDR調整済みp値<1 * 10-4)と有意に関連する発現を予測していました。これらのうち5419(81.9%)は、その後、保留されたテストセットで検証されました。また、WSIから直接前立腺癌特異的な細胞周期進行スコアを予測する能力を示しています。これらの発見は、現代のコンピュータービジョンモデルが、WSIから直接遺伝子発現表現型を予測するための安価でスケーラブルなソリューションを提供し、費用効果の高い大規模な研究と分子診断の機会を提供することを示唆しています。
Molecular phenotyping by gene expression profiling is common in contemporary cancer research and in molecular diagnostics. However, molecular profiling remains costly and resource intense to implement, and is just starting to be introduced into clinical diagnostics. Molecular changes, including genetic alterations and gene expression changes, occuring in tumors cause morphological changes in tissue, which can be observed on the microscopic level. The relationship between morphological patterns and some of the molecular phenotypes can be exploited to predict molecular phenotypes directly from routine haematoxylin and eosin (H&E) stained whole slide images (WSIs) using deep convolutional neural networks (CNNs). In this study, we propose a new, computationally efficient approach for disease specific modelling of relationships between morphology and gene expression, and we conducted the first transcriptome-wide analysis in prostate cancer, using CNNs to predict bulk RNA-sequencing estimates from WSIs of H&E stained tissue. The work is based on the TCGA PRAD study and includes both WSIs and RNA-seq data for 370 patients. Out of 15586 protein coding and sufficiently frequently expressed transcripts, 6618 had predicted expression significantly associated with RNA-seq estimates (FDR-adjusted p-value < 1*10-4) in a cross-validation. 5419 (81.9%) of these were subsequently validated in a held-out test set. We also demonstrate the ability to predict a prostate cancer specific cell cycle progression score directly from WSIs. These findings suggest that contemporary computer vision models offer an inexpensive and scalable solution for prediction of gene expression phenotypes directly from WSIs, providing opportunity for cost-effective large-scale research studies and molecular diagnostics.
updated: Mon Apr 19 2021 13:50:25 GMT+0000 (UTC)
published: Mon Apr 19 2021 13:50:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト