バッチ正規化(BN)は、ネットワークトレーニングを加速するための重要なコンポーネントの1つであり、医療画像分析の分野で広く採用されています。ただし、BNはバッチレベルでのみグローバル統計を計算し、同じアフィン変換をすべての空間座標に均一に適用します。これにより、異なるセマンティック構造の画像コントラストが抑制されます。この論文では、セマンティッククラス情報を正規化レイヤーに組み込んで、異なる領域(つまりクラス)に対応するアクティベーションを異なる方法で変調できるようにすることを提案します。したがって、ネットワークの正規化のために、グローバルな画像レベルの統計とローカルな地域ごとの統計の両方を同時に組み込むために、新しいDualNorm-UNetを開発します。具体的には、ローカル統計は、正規化レイヤーで学習されたセマンティックマスクを介して、さまざまなクラス領域に沿ってアクティブ化を適応的に変調することによって統合されます。既存の方法と比較して、私たちのアプローチは、正規化でセマンティック知識を活用し、堅牢なセグメンテーション結果のためのより識別力のある機能を生成します。さらに重要なことに、私たちのネットワークは、医療データの複数のドメイン(機関)からドメイン不変の情報をキャプチャする優れた能力を示しています。広範な実験により、提案されたDualNorm-UNetは、より複雑で可変的なデータ分散に直面しても、さまざまなセグメンテーションタスクのパフォーマンスを一貫して向上させることが示されています。コードはhttps://github.com/lambert-x/DualNorm-Unetで入手できます。
Batch Normalization (BN) is one of the key components for accelerating network training, and has been widely adopted in the medical image analysis field. However, BN only calculates the global statistics at the batch level, and applies the same affine transformation uniformly across all spatial coordinates, which would suppress the image contrast of different semantic structures. In this paper, we propose to incorporate the semantic class information into normalization layers, so that the activations corresponding to different regions (i.e., classes) can be modulated differently. We thus develop a novel DualNorm-UNet, to concurrently incorporate both global image-level statistics and local region-wise statistics for network normalization. Specifically, the local statistics are integrated by adaptively modulating the activations along different class regions via the learned semantic masks in the normalization layer. Compared with existing methods, our approach exploits semantic knowledge at normalization and yields more discriminative features for robust segmentation results. More importantly, our network demonstrates superior abilities in capturing domain-invariant information from multiple domains (institutions) of medical data. Extensive experiments show that our proposed DualNorm-UNet consistently improves the performance on various segmentation tasks, even in the face of more complex and variable data distributions. Code is available at https://github.com/lambert-x/DualNorm-Unet.