自動化された医用画像セグメンテーションは、医師がより迅速かつ正確に診断するのに役立ちます。医用画像セグメンテーションのディープ ラーニング ベースのモデルは、近年大きな進歩を遂げています。ただし、既存のモデルでは、U 字型アーキテクチャを効率的に改善するために Transformer と MLP を効果的に活用できていません。さらに、U 字型アーキテクチャのボトルネックでは、MLP のマルチスケール機能が十分に抽出されていません。この論文では、Swin Transformer とマルチスケール MLP、すなわち STM-UNet に基づく効率的な U 字型アーキテクチャを提案します。具体的には、Swin Transformer ブロックが追加され、STM-UNet の接続を残差接続の形でスキップします。これにより、グローバル フィーチャと長期的な依存関係のモデル化能力が向上します。一方、並列畳み込みモジュールを備えた新しい PCAS-MLP を設計し、アーキテクチャのボトルネックに配置して、セグメンテーション パフォーマンスの向上に貢献します。 ISIC 2016 と ISIC 2018 の実験結果は、提案手法の有効性を示しています。また、私たちの方法は、IoU と Dice に関して、いくつかの最先端の方法よりも優れています。私たちの方法は、高いセグメンテーション精度と低いモデルの複雑さの間のより良いトレードオフを達成しました。
Automated medical image segmentation can assist doctors to diagnose faster and more accurate. Deep learning based models for medical image segmentation have made great progress in recent years. However, the existing models fail to effectively leverage Transformer and MLP for improving U-shaped architecture efficiently. In addition, the multi-scale features of the MLP have not been fully extracted in the bottleneck of U-shaped architecture. In this paper, we propose an efficient U-shaped architecture based on Swin Transformer and multi-scale MLP, namely STM-UNet. Specifically, the Swin Transformer block is added to skip connection of STM-UNet in form of residual connection, which can enhance the modeling ability of global features and long-range dependency. Meanwhile, a novel PCAS-MLP with parallel convolution module is designed and placed into the bottleneck of our architecture to contribute to the improvement of segmentation performance. The experimental results on ISIC 2016 and ISIC 2018 demonstrate the effectiveness of our proposed method. Our method also outperforms several state-of-the-art methods in terms of IoU and Dice. Our method has achieved a better trade-off between high segmentation accuracy and low model complexity.