arXiv reaDer
肺結節分類のためのルーチン EHR からのイメージングと潜在的な臨床兆候を統合する縦方向マルチモーダル トランスフォーマー
Longitudinal Multimodal Transformer Integrating Imaging and Latent Clinical Signatures From Routine EHRs for Pulmonary Nodule Classification
孤立性肺結節 (SPN) 診断の予測モデルの精度は、反復イメージングと電子健康記録 (EHR) などの医療コンテキストを組み込むことで大幅に向上できます。ただし、画像処理や診断コードなどの臨床的に日常的なモダリティは、非同期であり、異なる時間スケールにわたって不規則にサンプリングされる可能性があり、これが長期的なマルチモーダル学習の障害となります。この研究では、SPN分類のために定期的に収集されたEHRからの長期的な臨床署名と反復イメージングを統合するトランスフォーマーベースのマルチモーダル戦略を提案します。私たちは、潜在的な臨床サインの教師なし解読を実行し、時間距離スケールの自己注意を活用して、臨床サインの表現と胸部コンピューター断層撮影 (CT) スキャンから共同で学習します。私たちの分類器は、公開データセットからの 2,668 件のスキャンと、胸部縦断 CT、請求コード、投薬、および本拠施設の EHR からの臨床検査による 1,149 人の被験者で事前トレーニングされています。困難なSPNを持つ227人の被験者を評価したところ、縦断マルチモーダルベースライン(0.824 vs 0.752 AUC)を上回るAUCの大幅な改善が明らかになり、単一断面マルチモーダルシナリオ(0.809 AUC)および縦断画像のみのシナリオ(0.741 AUC)を上回る改善が明らかになりました。 )。この研究は、縦断イメージング表現型と非イメージング表現型をトランスフォーマーと同時学習するための新しいアプローチによる重要な利点を実証しています。コードは https://github.com/MASILab/lmsignatures で入手できます。
The accuracy of predictive models for solitary pulmonary nodule (SPN) diagnosis can be greatly increased by incorporating repeat imaging and medical context, such as electronic health records (EHRs). However, clinically routine modalities such as imaging and diagnostic codes can be asynchronous and irregularly sampled over different time scales which are obstacles to longitudinal multimodal learning. In this work, we propose a transformer-based multimodal strategy to integrate repeat imaging with longitudinal clinical signatures from routinely collected EHRs for SPN classification. We perform unsupervised disentanglement of latent clinical signatures and leverage time-distance scaled self-attention to jointly learn from clinical signatures expressions and chest computed tomography (CT) scans. Our classifier is pretrained on 2,668 scans from a public dataset and 1,149 subjects with longitudinal chest CTs, billing codes, medications, and laboratory tests from EHRs of our home institution. Evaluation on 227 subjects with challenging SPNs revealed a significant AUC improvement over a longitudinal multimodal baseline (0.824 vs 0.752 AUC), as well as improvements over a single cross-section multimodal scenario (0.809 AUC) and a longitudinal imaging-only scenario (0.741 AUC). This work demonstrates significant advantages with a novel approach for co-learning longitudinal imaging and non-imaging phenotypes with transformers. Code available at https://github.com/MASILab/lmsignatures.
updated: Tue Jun 27 2023 21:52:50 GMT+0000 (UTC)
published: Thu Apr 06 2023 03:03:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト