arXiv reaDer
マルチパラメトリック磁気共鳴画像法における子宮頸がんのセグメンテーションを強化するためのマルチヘッド拡張エンコーダを備えた深層学習フレームワーク
Deep Learning Framework with Multi-Head Dilated Encoders for Enhanced Segmentation of Cervical Cancer on Multiparametric Magnetic Resonance Imaging
T2 強調磁気共鳴画像法 (MRI) と拡散強調画像法 (DWI) は、子宮頸がんの診断に不可欠な要素です。ただし、これらのチャネルを組み合わせて深層学習モデルをトレーニングすることは、画像の位置がずれているため困難です。ここでは、マルチパラメトリック MRI 画像の個別のエンコードに拡張畳み込みと共有残差接続を使用する新しいマルチヘッド フレームワークを提案します。ベースラインとして残差 U-Net モデルを採用し、一連のアーキテクチャ実験を実行して、マルチパラメトリック入力チャネルと特徴エンコード構成に基づいて腫瘍セグメンテーションのパフォーマンスを評価します。すべての実験は、局所進行子宮頸がん患者 207 人を含むコホートを使用して実施されました。 T2W MRI 用に個別の拡張エンコーディングを使用し、b1000 DWI と見かけの拡散係数 (ADC) 画像を組み合わせた、私たちが提案したマルチヘッド モデルは、最高の Dice 係数類似性 (DSC) スコア中央値 0.823 (95% 信頼区間 (CI)、0.595-) を達成しました。 0.797)、その差は統計的に有意ではありませんでしたが(p>0.05)、従来のマルチチャネルモデルであるDSC 0.788(95%CI、0.568-0.776)を上回りました(p>0.05)。私たちは、3D GRAD-CAM とチャネル ドロップアウトを使用してチャネル感度を調査し、正確な腫瘍セグメンテーションにとって T2W チャネルと ADC チャネルが非常に重要であることを強調しました。ただし、結果は、b1000 DWI が全体的なセグメンテーション パフォーマンスにわずかな影響を与えることを示しました。私たちは、個別の拡張特徴抽出器と独立したコンテキスト学習を使用することで、DWI の境界効果と歪みを低減するモデルの能力が向上し、セグメンテーションのパフォーマンスが向上することを実証しました。私たちの発見は、他のマルチモーダル セグメンテーション アプリケーションに拡張できる堅牢で一般化可能なモデルの開発に重大な影響を与える可能性があります。
T2-weighted magnetic resonance imaging (MRI) and diffusion-weighted imaging (DWI) are essential components for cervical cancer diagnosis. However, combining these channels for training deep learning models are challenging due to misalignment of images. Here, we propose a novel multi-head framework that uses dilated convolutions and shared residual connections for separate encoding of multiparametric MRI images. We employ a residual U-Net model as a baseline, and perform a series of architectural experiments to evaluate the tumor segmentation performance based on multiparametric input channels and feature encoding configurations. All experiments were performed using a cohort including 207 patients with locally advanced cervical cancer. Our proposed multi-head model using separate dilated encoding for T2W MRI, and combined b1000 DWI and apparent diffusion coefficient (ADC) images achieved the best median Dice coefficient similarity (DSC) score, 0.823 (95% confidence interval (CI), 0.595-0.797), outperforming the conventional multi-channel model, DSC 0.788 (95% CI, 0.568-0.776), although the difference was not statistically significant (p>0.05). We investigated channel sensitivity using 3D GRAD-CAM and channel dropout, and highlighted the critical importance of T2W and ADC channels for accurate tumor segmentations. However, our results showed that b1000 DWI had a minor impact on overall segmentation performance. We demonstrated that the use of separate dilated feature extractors and independent contextual learning improved the model's ability to reduce the boundary effects and distortion of DWI, leading to improved segmentation performance. Our findings can have significant implications for the development of robust and generalizable models that can extend to other multi-modal segmentation applications.
updated: Mon Jun 19 2023 19:41:21 GMT+0000 (UTC)
published: Mon Jun 19 2023 19:41:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト