arXiv reaDer
HST-MRF: 医用画像セグメンテーションのための多受容野を備えた異種 Swin Transformer
HST-MRF: Heterogeneous Swin Transformer with Multi-Receptive Field for Medical Image Segmentation
Transformer は、その優れた長距離モデリング機能により、医用画像セグメンテーションでの使用に成功しています。ただし、Transformer クラス モデルを構築する場合は、パッチ セグメンテーションが必要です。このプロセスは、医療画像の組織構造を破壊し、関連する情報を失う可能性があります。この研究では、医用画像セグメンテーションのための U 字型ネットワークに基づく多受容野 (HST-MRF) モデルを備えた異種 Swin トランスフォーマーを提案しました。主な目的は、異なる受容野の下でパッチ情報を融合することにより、トランスフォーマーを使用したパッチセグメンテーションによって引き起こされる構造情報の損失の問題を解決することです。異種 Swin Transformer (HST) はコア モジュールであり、異種注意を通じて多受容野パッチ情報の相互作用を実現し、それを次の段階の段階的学習に渡します。また、2 段階の融合モジュールであるマルチモーダル バイリニア プーリング (MBP) を設計し、HST が多受容野情報をさらに融合し、低レベルと高レベルのセマンティック情報を組み合わせて病変領域の正確な位置を特定できるようにしました。さらに、アダプティブ パッチ埋め込み (APE) およびソフト チャネル アテンション (SCA) モジュールを開発して、それぞれパッチ埋め込みおよびフィルタリング チャネル機能を取得する際により価値のある情報を保持し、それによってモデル セグメンテーションの品質を向上させました。ポリープと皮膚病変のセグメンテーション タスクの複数のデータセットで HST-MRF を評価しました。実験結果は、提案された方法が最先端のモデルよりも優れており、優れたパフォーマンスを達成できることを示しています。さらに、各モジュールの有効性と、アブレーション実験による構造情報の損失を減らす際の多受容野セグメンテーションの利点を検証しました。
The Transformer has been successfully used in medical image segmentation due to its excellent long-range modeling capabilities. However, patch segmentation is necessary when building a Transformer class model. This process may disrupt the tissue structure in medical images, resulting in the loss of relevant information. In this study, we proposed a Heterogeneous Swin Transformer with Multi-Receptive Field (HST-MRF) model based on U-shaped networks for medical image segmentation. The main purpose is to solve the problem of loss of structural information caused by patch segmentation using transformer by fusing patch information under different receptive fields. The heterogeneous Swin Transformer (HST) is the core module, which achieves the interaction of multi-receptive field patch information through heterogeneous attention and passes it to the next stage for progressive learning. We also designed a two-stage fusion module, multimodal bilinear pooling (MBP), to assist HST in further fusing multi-receptive field information and combining low-level and high-level semantic information for accurate localization of lesion regions. In addition, we developed adaptive patch embedding (APE) and soft channel attention (SCA) modules to retain more valuable information when acquiring patch embedding and filtering channel features, respectively, thereby improving model segmentation quality. We evaluated HST-MRF on multiple datasets for polyp and skin lesion segmentation tasks. Experimental results show that our proposed method outperforms state-of-the-art models and can achieve superior performance. Furthermore, we verified the effectiveness of each module and the benefits of multi-receptive field segmentation in reducing the loss of structural information through ablation experiments.
updated: Mon Apr 10 2023 14:30:03 GMT+0000 (UTC)
published: Mon Apr 10 2023 14:30:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト