コンピューター支援診断アプリケーション向けのマルチモダリティポジトロン放出断層撮影およびコンピューター断層撮影(PET-CT)画像の分析には、CTからの解剖学的位置測定と異常領域を検出するためのPETの感度を組み合わせる必要があります。 PET-CT画像解析の現在の方法は、モダリティを個別に処理するか、画像解析タスクに関する知識に基づいて各モダリティからの情報を融合します。これらの方法は、一般に、異なる場所で異なる優先順位を持つ異なるモダリティにわたって異なる情報をエンコードする空間的に変化する視覚特性を考慮しません。たとえば、肺での異常なPET摂取の高さは、心臓での生理的PET摂取よりも腫瘍検出にとって有意義です。私たちの目的は、マルチモダリティPET-CTの補完情報と、マルチモダリティ医療画像解析のための補完情報の融合を学習する新しい教師付き畳み込みニューラルネットワーク(CNN)との融合を改善することです。 CNNはまずモダリティ固有の機能をエンコードしてから、それらを使用して、空間的に異なるフュージョンマップを導出し、異なる空間位置での各モダリティの機能の相対的な重要性を定量化します。次に、これらの融合マップにモダリティ固有の特徴マップを乗算して、さまざまな場所で補完的なマルチモダリティ情報の表現を取得し、画像分析に使用できます。肺癌のPET-CT画像のデータセットを使用して、異なる融合要件を持つ複数の領域を検出およびセグメント化するCNNの能力を評価しました。マルチモダリティ画像の融合とセグメンテーションのための手法をベースライン手法と比較しました。私たちの調査結果は、CNNが前景検出精度(99.29%、p <0.05)をフュージョンベースラインよりも著しく高く、ダイススコアが最近のPET-CT腫瘍セグメンテーション法よりも著しく高いことを示しています。
The analysis of multi-modality positron emission tomography and computed tomography (PET-CT) images for computer aided diagnosis applications requires combining the sensitivity of PET to detect abnormal regions with anatomical localization from CT. Current methods for PET-CT image analysis either process the modalities separately or fuse information from each modality based on knowledge about the image analysis task. These methods generally do not consider the spatially varying visual characteristics that encode different information across the different modalities, which have different priorities at different locations. For example, a high abnormal PET uptake in the lungs is more meaningful for tumor detection than physiological PET uptake in the heart. Our aim is to improve fusion of the complementary information in multi-modality PET-CT with a new supervised convolutional neural network (CNN) that learns to fuse complementary information for multi-modality medical image analysis. Our CNN first encodes modality-specific features and then uses them to derive a spatially varying fusion map that quantifies the relative importance of each modality's features across different spatial locations. These fusion maps are then multiplied with the modality-specific feature maps to obtain a representation of the complementary multi-modality information at different locations, which can then be used for image analysis. We evaluated the ability of our CNN to detect and segment multiple regions with different fusion requirements using a dataset of PET-CT images of lung cancer. We compared our method to baseline techniques for multi-modality image fusion and segmentation. Our findings show that our CNN had a significantly higher foreground detection accuracy (99.29%, p < 0.05) than the fusion baselines and a significantly higher Dice score (63.85%) than recent PET-CT tumor segmentation methods.