Deep Multi-task Prediction of Lung Cancer and Cancer-free Progression from Censored Heterogenous Clinical Imaging
 現在、肺がんのリスクが高い個人(例:55歳から80歳までのヘビースモーカー)には、年1回の低線量コンピューター断層撮影(CT)肺スクリーニングが推奨されています。推奨されるスクリーニングの実施により、すべての原因による死亡率が大幅に減少しますが、スクリーニング結果の大部分は癌に対して陰性です。個別化された画像ベースのバイオマーカーに基づいて非常にリスクの低い患者を特定できれば、リスクの高い患者に医療資源をより効率的に割り当てることができ、電離放射線への全体的な被曝を減らすことができます。この作業では、マルチタスク(診断と予後)の深い畳み込みニューラルネットワークを提案し、ベースラインモデルよりも診断精度を向上させると同時に、パーソナライズされた無癌進行時間(CFPT)を推定します。単一のネガティブスクリーニングスキャンでも小さな増分値を提供できるように、弱教師付き回帰を実行するために、新しい検閲回帰損失(CRL)が提案されています。ここでは、ヴァンダービルト肺スクリーニングプログラム(VLSP)および分子キャラクタリゼーション研究所(MCL)コホートの1433名の匿名化された患者からの2287スキャンを調査します。 5倍の交差検証を使用して、2つのシナリオの下で3D注目度ベースのネットワークをトレーニングします。(1)分類のみを使用したシングルタスク学習、および(2)分類と回帰の両方を使用したマルチタスク学習。シングルタスク学習は、Kaggleチャレンジ受賞者の事前トレーニングモデル(0.878 v。0.856)と比較して、より高いAUCにつながり、マルチタスク学習は、シングルタスク1を大幅に改善します(AUC 0.895、p <0.01、McNemarテスト) 。要約すると、画像ベースの予測CFPTは、翌年の肺がんの予測とデータ評価に使用できます。
Annual low dose computed tomography (CT) lung screening is currently advised for individuals at high risk of lung cancer (e.g., heavy smokers between 55 and 80 years old). The recommended screening practice significantly reduces all-cause mortality, but the vast majority of screening results are negative for cancer. If patients at very low risk could be identified based on individualized, image-based biomarkers, the health care resources could be more efficiently allocated to higher risk patients and reduce overall exposure to ionizing radiation. In this work, we propose a multi-task (diagnosis and prognosis) deep convolutional neural network to improve the diagnostic accuracy over a baseline model while simultaneously estimating a personalized cancer-free progression time (CFPT). A novel Censored Regression Loss (CRL) is proposed to perform weakly supervised regression so that even single negative screening scans can provide small incremental value. Herein, we study 2287 scans from 1433 de-identified patients from the Vanderbilt Lung Screening Program (VLSP) and Molecular Characterization Laboratories (MCL) cohorts. Using five-fold cross-validation, we train a 3D attention-based network under two scenarios: (1) single-task learning with only classification, and (2) multi-task learning with both classification and regression. The single-task learning leads to a higher AUC compared with the Kaggle challenge winner pre-trained model (0.878 v. 0.856), and multi-task learning significantly improves the single-task one (AUC 0.895, p<0.01, McNemar test). In summary, the image-based predicted CFPT can be used in follow-up year lung cancer prediction and data assessment.
updated: Mon Feb 17 2020 17:38:44 GMT+0000 (UTC)
published: Tue Nov 12 2019 19:39:22 GMT+0000 (UTC)
