畳み込みニューラルネットワークに基づく方法により、生物医学画像セグメンテーションのパフォーマンスが向上しました。ただし、これらの方法のほとんどは、可変サイズのオブジェクトを効率的にセグメント化し、生物医学のユースケースで一般的な小さくて偏ったデータセットでトレーニングすることはできません。可変サイズで発生する課題に対処するためにマルチスケール融合アプローチを組み込んだ方法が存在しますが、通常、一般的なセマンティックセグメンテーションの問題により適した複雑なモデルを使用します。本論文では、医療画像セグメンテーションのために特別に設計されたマルチスケール残差融合ネットワーク(MSRF-Net)と呼ばれる新しいアーキテクチャを提案します。提案されたMSRF-Netは、Dual-Scale Dense Fusion(DSDF)ブロックを使用して、さまざまな受容野のマルチスケール機能を交換することができます。 DSDFブロックは、2つの異なる解像度スケール間で厳密に情報を交換でき、MSRFサブネットワークは複数のDSDFブロックを順番に使用してマルチスケールフュージョンを実行します。これにより、解像度の維持、情報フローの改善、高レベルと低レベルの両方の機能の伝播が可能になり、正確なセグメンテーションマップを取得できます。提案されたMSRF-Netは、オブジェクトの変動性をキャプチャすることを可能にし、さまざまな生物医学データセットで改善された結果を提供します。 MSRF-Netでの広範な実験は、提案された方法が4つの公的に利用可能なデータセットで最先端の医療画像セグメンテーション方法よりも優れていることを示しています。 Kvasir-SEG、CVC-ClinicDB、2018 Data Science Bowlデータセット、およびISIC-2018皮膚病変セグメンテーションチャレンジデータセットで、それぞれ0.9217、0.9420、および0.9224、0.8824のダイス係数を達成します。さらに一般化可能性テストを実施し、CVC-ClinicDBとKvasir-SEGでそれぞれ0.7921と0.7575のダイス係数を達成しました。
Methods based on convolutional neural networks have improved the performance of biomedical image segmentation. However, most of these methods cannot efficiently segment objects of variable sizes and train on small and biased datasets, which are common for biomedical use cases. While methods exist that incorporate multi-scale fusion approaches to address the challenges arising with variable sizes, they usually use complex models that are more suitable for general semantic segmentation problems. In this paper, we propose a novel architecture called Multi-Scale Residual Fusion Network (MSRF-Net), which is specially designed for medical image segmentation. The proposed MSRF-Net is able to exchange multi-scale features of varying receptive fields using a Dual-Scale Dense Fusion (DSDF) block. Our DSDF block can exchange information rigorously across two different resolution scales, and our MSRF sub-network uses multiple DSDF blocks in sequence to perform multi-scale fusion. This allows the preservation of resolution, improved information flow and propagation of both high- and low-level features to obtain accurate segmentation maps. The proposed MSRF-Net allows to capture object variabilities and provides improved results on different biomedical datasets. Extensive experiments on MSRF-Net demonstrate that the proposed method outperforms the cutting-edge medical image segmentation methods on four publicly available datasets. We achieve the dice coefficient of 0.9217, 0.9420, and 0.9224, 0.8824 on Kvasir-SEG, CVC-ClinicDB, 2018 Data Science Bowl dataset, and ISIC-2018 skin lesion segmentation challenge dataset respectively. We further conducted generalizability tests and achieved a dice coefficient of 0.7921 and 0.7575 on CVC-ClinicDB and Kvasir-SEG, respectively.