バッチ正規化 (BN) は、画像のバッチの統計に基づいてアクティベーションを一様にシフトおよびスケーリングします。ただし、背景は画像全体の大部分を占めるため、背景ピクセルの強度分布が BN 統計を支配することがよくあります。このホワイトペーパーでは、前景ピクセルの強度分布を使用して BN を強化することに焦点を当てています。これは、画像のセグメンテーションにとって本当に重要です。カテゴリ統計に従って活性化を正規化するために、カテゴリ正規化(CateNorm)と呼ばれる新しい正規化戦略を提案します。カテゴリ統計は、前景に属する画像内の特定の領域を動的に変調することによって取得されます。 CateNorm は、さまざまなドメインから取得した 5 つの公開データセット全体で正確かつ堅牢なセグメンテーション結果を示し、複雑で可変的なデータ分布をカバーします。これは、医療データの複数のドメイン (機関) からドメイン不変の情報を取得する CateNorm の機能に起因します。コードは https://github.com/lambert-x/CateNorm で入手できます。
Batch normalization (BN) uniformly shifts and scales the activations based on the statistics of a batch of images. However, the intensity distribution of the background pixels often dominates the BN statistics because the background accounts for a large proportion of the entire image. This paper focuses on enhancing BN with the intensity distribution of foreground pixels, the one that really matters for image segmentation. We propose a new normalization strategy, named categorical normalization (CateNorm), to normalize the activations according to categorical statistics. The categorical statistics are obtained by dynamically modulating specific regions in an image that belong to the foreground. CateNorm demonstrates both precise and robust segmentation results across five public datasets obtained from different domains, covering complex and variable data distributions. It is attributable to the ability of CateNorm to capture domain-invariant information from multiple domains (institutions) of medical data. Code is available at https://github.com/lambert-x/CateNorm.