arXiv reaDer
転移学習と融合戦略を使用した胸部 X 線からの慢性閉塞性肺疾患の早期診断
Early Diagnosis of Chronic Obstructive Pulmonary Disease from Chest X-Rays using Transfer Learning and Fusion Strategies
慢性閉塞性肺疾患 (COPD) は、世界で最も一般的な慢性疾患の 1 つであり、世界中で 3 番目に多い死亡原因です。多くの場合、過小診断されるか、疾患経過の後半まで診断されません。スパイロメトリー検査は、COPD を診断するためのゴールド スタンダードですが、特に資源の乏しい国では入手が難しい場合があります。ただし、胸部 X 線 (CXR) は容易に入手でき、さらなる検査を受ける必要がある COPD 患者を特定するためのスクリーニング ツールとして役立つ可能性があります。現在、大規模なマルチサイトおよびマルチモーダル データを使用して COPD 患者を検出し、人口統計学的グループ間の公平性を評価するディープ ラーニング (DL) アルゴリズムを適用する研究はありません。私たちの研究では 3 つの CXR データセットを使用しています。CheXpert でモデルを事前トレーニングし、MIMIC-CXR で開発し、Emory-CXR でモデルを検証します。 COPD の初期段階にあり、人工呼吸器を使用していない患者の CXR が、モデルのトレーニングと検証のために選択されます。 MIMIC-CXR と Emory-CXR の両方のテスト データセットの基本モデルで、真陽性のケースの Grad-CAM ヒートマップを視覚化します。さらに、(1) MIMIC-CXR を使用したバギングおよびスタッキング方法を含むモデル レベルの融合、および (2) MIMIC-CXR および Emory-CXR を使用したマルチサイト データを含むデータ レベルの融合、および複数の 2 つの融合スキームを提案します。 -MIMIC-CXR と MIMIC-IV EHR を使用してモデル全体のパフォーマンスを向上させるモーダル。公平性分析を実行して、異なる人口統計グループ間で融合スキームのパフォーマンスに不一致があるかどうかを評価します。この結果は、DL モデルが CXR を使用して COPD を検出できることを示しています。これにより、特にスパイロメトリーよりも CXR の方がアクセスしやすいリソースの少ない地域で、早期スクリーニングが容易になります。マルチサイト データ フュージョン スキームは、Emory-CXR テスト データのモデルの一般化可能性を向上させる可能性があります。 COPDを予測するためにCXRまたは他のモダリティを使用することに関するさらなる研究は、将来の作業にあるはずです.
Chronic obstructive pulmonary disease (COPD) is one of the most common chronic illnesses in the world and the third leading cause of mortality worldwide. It is often underdiagnosed or not diagnosed until later in the disease course. Spirometry tests are the gold standard for diagnosing COPD but can be difficult to obtain, especially in resource-poor countries. Chest X-rays (CXRs), however, are readily available and may serve as a screening tool to identify patients with COPD who should undergo further testing. Currently, no research applies deep learning (DL) algorithms that use large multi-site and multi-modal data to detect COPD patients and evaluate fairness across demographic groups. We use three CXR datasets in our study, CheXpert to pre-train models, MIMIC-CXR to develop, and Emory-CXR to validate our models. The CXRs from patients in the early stage of COPD and not on mechanical ventilation are selected for model training and validation. We visualize the Grad-CAM heatmaps of the true positive cases on the base model for both MIMIC-CXR and Emory-CXR test datasets. We further propose two fusion schemes, (1) model-level fusion, including bagging and stacking methods using MIMIC-CXR, and (2) data-level fusion, including multi-site data using MIMIC-CXR and Emory-CXR, and multi-modal using MIMIC-CXRs and MIMIC-IV EHR, to improve the overall model performance. Fairness analysis is performed to evaluate if the fusion schemes have a discrepancy in the performance among different demographic groups. The results demonstrate that DL models can detect COPD using CXRs, which can facilitate early screening, especially in low-resource regions where CXRs are more accessible than spirometry. The multi-site data fusion scheme could improve the model generalizability on the Emory-CXR test data. Further studies on using CXR or other modalities to predict COPD ought to be in future work.
updated: Sun Nov 13 2022 15:12:22 GMT+0000 (UTC)
published: Sun Nov 13 2022 15:12:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト