異なる病変はスケールと形状が大幅に異なるため、マルチスケール情報を効果的に統合することは、眼底病変の挑戦的なマルチクラスセグメンテーションにとって非常に重要です。マルチスケールオブジェクトのセグメンテーションを正常に処理するために、いくつかの方法が提案されています。ただし、以前の研究では2つの問題は考慮されていません。 1つ目は、隣接する機能レベル間の相互作用の欠如です。これにより、高レベルの機能が低レベルの機能から逸脱し、詳細な手がかりが失われます。 2つ目は、低レベルの機能と高レベルの機能の競合です。これは、機能のさまざまなスケールを学習するために発生し、モデルを混乱させ、最終的な予測の精度を低下させます。本論文では、前述の問題に対処するために提案されたプログレッシブ機能融合(PFF)ブロックと動的注意ブロック(DAB)を統合するプログレッシブマルチスケールコンシステントネットワーク(PMCNet)を提案します。具体的には、PFFブロックは、隣接するエンコーディングレイヤーからのマルチスケール機能を段階的に統合し、きめ細かい詳細と高レベルのセマンティクスを集約することで、各レイヤーの機能学習を容易にします。さまざまなスケールの機能は一貫している必要があるため、DABは、さまざまなスケールの融合された機能から注意深い手がかりを動的に学習するように設計されており、マルチスケール機能に存在する本質的な競合をスムーズにすることを目的としています。提案された2つのPFFおよびDABブロックは、既製のバックボーンネットワークと統合して、眼底病変のマルチクラスセグメンテーションにおけるマルチスケールおよび機能の不整合の2つの問題に対処できます。これにより、機能の機能表現が向上します。スペース。 3つの公開データセットでの実験結果は、提案された方法が最近の最先端の方法よりも効果的であることを示しています。
Effectively integrating multi-scale information is of considerable significance for the challenging multi-class segmentation of fundus lesions because different lesions vary significantly in scales and shapes. Several methods have been proposed to successfully handle the multi-scale object segmentation. However, two issues are not considered in previous studies. The first is the lack of interaction between adjacent feature levels, and this will lead to the deviation of high-level features from low-level features and the loss of detailed cues. The second is the conflict between the low-level and high-level features, this occurs because they learn different scales of features, thereby confusing the model and decreasing the accuracy of the final prediction. In this paper, we propose a progressive multi-scale consistent network (PMCNet) that integrates the proposed progressive feature fusion (PFF) block and dynamic attention block (DAB) to address the aforementioned issues. Specifically, PFF block progressively integrates multi-scale features from adjacent encoding layers, facilitating feature learning of each layer by aggregating fine-grained details and high-level semantics. As features at different scales should be consistent, DAB is designed to dynamically learn the attentive cues from the fused features at different scales, thus aiming to smooth the essential conflicts existing in multi-scale features. The two proposed PFF and DAB blocks can be integrated with the off-the-shelf backbone networks to address the two issues of multi-scale and feature inconsistency in the multi-class segmentation of fundus lesions, which will produce better feature representation in the feature space. Experimental results on three public datasets indicate that the proposed method is more effective than recent state-of-the-art methods.