Distanced LSTM: Time-Distanced Gates in Long Short-Term Memory Models for Lung Cancer Detection
  肺結節の検出と癌の予測の分野は、大規模な公共データアーカイブのサポートにより急速に発展しています。これまでの研究では、主に断面(単一)CTデータに焦点が当てられてきました。ここでは、縦断的なデータを検討します。 Long Short-Term Memory(LSTM)モデルは、一定の間隔の時間ポイント(つまり、等しい時間間隔)での学習に対処します。ただし、臨床イメージングは、多くの場合、不均一で不規則な収集を伴う患者のニーズに従います。定期的および不規則な縦断的サンプルの両方をモデル化するために、一時的に変化する取得のために、LSTMモデルをDistanced LSTM(DLSTM)で一般化します。 DLSTMには、定期的および不規則にサンプリングされた間隔で学習できるようにする時間的強調モデル(TEM)が含まれています。簡単に説明すると、(1)縦方向のスキャン間の時間間隔が明示的にモデル化され、(2)時間的に調整可能な忘却および入力ゲートが不規則な時間サンプリングのために導入されます。 (3)最新の縦方向スキャンには追加の強調用語があります。シミュレートされたデータ、1794国立肺スクリーニングトライアル(NLST)スキャン、および不均一で不規則な一時的アクセッションを持つ1420の臨床的に取得されたデータを含む3つのデータセットでDLSTMフレームワークを評価します。最初の2つのデータセットの実験は、シミュレーションと定期的にサンプリングされたデータセットの両方で本方法が競争力のあるパフォーマンスを達成することを示しています(たとえば、NLSTのF1スコアでLSTMを0.6785から0.7085に改善します)。臨床的および不規則に収集されたデータの外部検証では、ベンチマークはROC曲線(AUC)スコア下の領域で0.8350(CNN機能)および0.8380(LSTM)を達成し、提案されたDLSTMは0.8905を達成しました。
The field of lung nodule detection and cancer prediction has been rapidly developing with the support of large public data archives. Previous studies have largely focused on cross-sectional (single) CT data. Herein, we consider longitudinal data. The Long Short-Term Memory (LSTM) model addresses learning with regularly spaced time points (i.e., equal temporal intervals). However, clinical imaging follows patient needs with often heterogeneous, irregular acquisitions. To model both regular and irregular longitudinal samples, we generalize the LSTM model with the Distanced LSTM (DLSTM) for temporally varied acquisitions. The DLSTM includes a Temporal Emphasis Model (TEM) that enables learning across regularly and irregularly sampled intervals. Briefly, (1) the time intervals between longitudinal scans are modeled explicitly, (2) temporally adjustable forget and input gates are introduced for irregular temporal sampling; and (3) the latest longitudinal scan has an additional emphasis term. We evaluate the DLSTM framework in three datasets including simulated data, 1794 National Lung Screening Trial (NLST) scans, and 1420 clinically acquired data with heterogeneous and irregular temporal accession. The experiments on the first two datasets demonstrate that our method achieves competitive performance on both simulated and regularly sampled datasets (e.g. improve LSTM from 0.6785 to 0.7085 on F1 score in NLST). In external validation of clinically and irregularly acquired data, the benchmarks achieved 0.8350 (CNN feature) and 0.8380 (LSTM) on the area under the ROC curve (AUC) score, while the proposed DLSTM achieves 0.8905.
updated: Wed Sep 11 2019 19:25:40 GMT+0000 (UTC)
published: Wed Sep 11 2019 19:25:40 GMT+0000 (UTC)
