効率的な医用画像セグメンテーションは、軽量の実装フレームワークを使用して、医用画像の正確なピクセル単位の予測を提供することを目的としています。ただし、軽量フレームワークは通常、優れたパフォーマンスを達成できず、クロスドメイン タスクでの一般化能力が低いという欠点があります。このホワイトペーパーでは、クロスドメインの医療画像を効率的にセグメンテーションするための一般化可能な知識の蒸留について説明します。異なる医療データセット間のドメイン ギャップを考慮して、モデル固有のアライメント ネットワーク (MSAN) を提案し、ドメイン不変表現を取得します。一方、カスタマイズされた整合整合性トレーニング (ACT) 戦略は、MSAN トレーニングを促進するように設計されています。 MSAN のドメイン不変代表ベクトルを考慮して、クロスドメイン蒸留のための 2 つの一般化可能な知識蒸留スキーム、二重対照グラフ蒸留 (DCGD) とドメイン不変クロス蒸留 (DICD) を提案します。具体的には、DCGD では、データ分布の観点からカップリング内およびカップリング間のセマンティック相関を表すために、2 種類の暗黙的な対照グラフが設計されています。 DICD では、2 つのモデル (つまり、教師と生徒) からのドメイン不変のセマンティック ベクトルを活用して、MSAN のヘッダー交換によって機能をクロス再構築します。これにより、生徒モデルのエンコーダとデコーダの両方の一般化が改善されます。 .さらに、Frechet Semantic Distance (FSD) という名前のメトリックは、正規化されたドメイン不変機能の有効性を検証するために調整されています。肝臓および網膜血管セグメンテーション データセットに対して実施された広範な実験は、軽量フレームワークでのパフォーマンスと一般化の点で、この方法の優位性を示しています。
Efficient medical image segmentation aims to provide accurate pixel-wise predictions for medical images with a lightweight implementation framework. However, lightweight frameworks generally fail to achieve superior performance and suffer from poor generalizable ability on cross-domain tasks. In this paper, we explore the generalizable knowledge distillation for the efficient segmentation of cross-domain medical images. Considering the domain gaps between different medical datasets, we propose the Model-Specific Alignment Networks (MSAN) to obtain the domain-invariant representations. Meanwhile, a customized Alignment Consistency Training (ACT) strategy is designed to promote the MSAN training. Considering the domain-invariant representative vectors in MSAN, we propose two generalizable knowledge distillation schemes for cross-domain distillation, Dual Contrastive Graph Distillation (DCGD) and Domain-Invariant Cross Distillation (DICD). Specifically, in DCGD, two types of implicit contrastive graphs are designed to represent the intra-coupling and inter-coupling semantic correlations from the perspective of data distribution. In DICD, the domain-invariant semantic vectors from the two models (i.e., teacher and student) are leveraged to cross-reconstruct features by the header exchange of MSAN, which achieves improvement in the generalization of both the encoder and decoder in the student model. Furthermore, a metric named Frechet Semantic Distance (FSD) is tailored to verify the effectiveness of the regularized domain-invariant features. Extensive experiments conducted on the Liver and Retinal Vessel Segmentation datasets demonstrate the superiority of our method, in terms of performance and generalization on lightweight frameworks.