arXiv reaDer
教師なしクロスドメインセマンティックセグメンテーションのためのマルチモダリティ卵巣腫瘍超音波画像データセット
A Multi-Modality Ovarian Tumor Ultrasound Image Dataset for Unsupervised Cross-Domain Semantic Segmentation
卵巣がんは、最も有害な婦人科疾患の1つです。コンピューター支援技術を用いて卵巣腫瘍を早期に検出することで、死亡率を効率的に下げることができます。医療水準の向上に伴い、超音波画像は臨床治療に広く適用されています。ただし、最近の注目すべき方法は、主にシングルモダリティ超音波卵巣腫瘍のセグメンテーションまたは認識に焦点を当てています。これは、マルチモダリティ超音波卵巣腫瘍画像の表現能力を調査する研究がまだ不足していることを意味します。この問題を解決するために、1469個の2d超音波画像と170個の造影超音波検査(CEUS)画像をピクセル単位およびグローバル単位の注釈で含むマルチモダリティ卵巣腫瘍超音波(MMOTU)画像データセットを提案します。 MMOTUに基づいて、教師なしクロスドメインセマンティックセグメンテーションタスクに主に焦点を当てます。ドメインシフトの問題を解決するために、Dual-Scheme Domain-Selected Network(DS ^ 2Net)という名前の機能アライメントベースのアーキテクチャを提案します。具体的には、まずソースエンコーダーとターゲットエンコーダーを設計して、ソース画像とターゲット画像の2つのスタイルの特徴を抽出します。次に、Domain-Distinct Selected Module(DDSM)とDomain-Universal Selected Module(DUSM)を提案して、2つのスタイル(ソーススタイルまたはターゲットスタイル)で個別のユニバーサル機能を抽出します。最後に、これら2種類の機能を融合し、それらをソースデコーダーとターゲットデコーダーにフィードして、最終的な予測を生成します。 MMOTU画像データセットの広範な比較実験と分析は、DS^2Netが2D超音波画像とCEUS画像の双方向クロスドメイン適応のセグメンテーションパフォーマンスを向上させることができることを示しています。
Ovarian cancer is one of the most harmful gynecological diseases. Detecting ovarian tumors in early stage with computer-aided techniques can efficiently decrease the mortality rate. With the improvement of medical treatment standard, ultrasound images are widely applied in clinical treatment. However, recent notable methods mainly focus on single-modality ultrasound ovarian tumor segmentation or recognition, which means there still lacks of researches on exploring the representation capability of multi-modality ultrasound ovarian tumor images. To solve this problem, we propose a Multi-Modality Ovarian Tumor Ultrasound (MMOTU) image dataset containing 1469 2d ultrasound images and 170 contrast enhanced ultrasonography (CEUS) images with pixel-wise and global-wise annotations. Based on MMOTU, we mainly focus on unsupervised cross-domain semantic segmentation task. To solve the domain shift problem, we propose a feature alignment based architecture named Dual-Scheme Domain-Selected Network (DS^2Net). Specifically, we first design source-encoder and target-encoder to extract two-style features of source and target images. Then, we propose Domain-Distinct Selected Module (DDSM) and Domain-Universal Selected Module (DUSM) to extract the distinct and universal features in two styles (source-style or target-style). Finally, we fuse these two kinds of features and feed them into the source-decoder and target-decoder to generate final predictions. Extensive comparison experiments and analysis on MMOTU image dataset show that DS^2Net can boost the segmentation performance for bidirectional cross-domain adaptation of 2d ultrasound images and CEUS images.
updated: Thu Jul 14 2022 10:23:17 GMT+0000 (UTC)
published: Thu Jul 14 2022 10:23:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト