U-Net とその拡張機能は、医療画像のセグメンテーションで大きな成功を収めています。ただし、通常の畳み込み操作に固有のローカル特性により、U-Net エンコーダーはグローバル コンテキスト情報を効果的に抽出できません。さらに、単純なスキップ接続では、顕著な特徴を捉えることができません。この作業では、ハイブリッド畳み込みとマルチスケールのアテンション ゲートを組み込んだ完全畳み込みセグメンテーション ネットワーク (CMU-Net) を提案します。 ConvMixer モジュールは、離れた空間位置の特徴を混合することにより、グローバル コンテキスト情報を抽出します。さらに、マルチスケール アテンション ゲートは、貴重な機能を強調し、効率的なスキップ接続を実現します。乳房超音波データセットと甲状腺超音波画像データセットの両方を使用して、提案された方法を評価します。 CMU-Net は、73.27% と 84.75% の平均 Intersection over Union (IoU) 値と、84.81% と 91.71% の F1 スコアを達成しています。コードは https://github.com/FengheTan9/CMU-Net で入手できます。
U-Net and its extensions have achieved great success in medical image segmentation. However, due to the inherent local characteristics of ordinary convolution operations, U-Net encoder cannot effectively extract global context information. In addition, simple skip connections cannot capture salient features. In this work, we propose a fully convolutional segmentation network (CMU-Net) which incorporates hybrid convolutions and multi-scale attention gate. The ConvMixer module extracts global context information by mixing features at distant spatial locations. Moreover, the multi-scale attention gate emphasizes valuable features and achieves efficient skip connections. We evaluate the proposed method using both breast ultrasound datasets and a thyroid ultrasound image dataset; and CMU-Net achieves average Intersection over Union (IoU) values of 73.27% and 84.75%, and F1 scores of 84.81% and 91.71%. The code is available at https://github.com/FengheTan9/CMU-Net.