生成モデルは、画像認識で広く提案されており、分布が実際の画像に似ている画像をより多く生成します。多くの場合、実際のデータと生成されたデータを区別するために弁別ネットワークが導入されます。このようなモデルは、ターゲット データセットに含まれるデータから転送されたスタイル データを区別する役割を担う弁別器ネットワークを利用します。ただし、そうすることで、ネットワークは強度分布の不一致に焦点を当て、データセット間の構造上の違いを見落とす可能性があります。この論文では、生成された画像の構造がターゲットデータセットの構造と同様であることを保証するために、新しい画像から画像への変換問題を定式化します。画像セグメンテーションを実行するときに、トレーニング セットとテスト セットの間の強度と構造の違いの両方を説明する、シンプルでありながら強力な Structure-Unbiased Adversarial (SUA) ネットワークを提案します。これは、空間変換ブロックとそれに続く強度分布レンダリング モジュールで構成されます。空間変換ブロックは、2 つの画像間の構造のギャップを減らし、逆変形フィールドを生成して、最終的なセグメント化された画像を元に戻すために提案されています。次に、強度分布レンダリング モジュールは、変形した構造をターゲット強度分布で画像にレンダリングします。実験結果は、提案された SUA メソッドが複数のデータセット間で強度分布と構造内容の両方を転送する機能を備えていることを示しています。
Generative models have been widely proposed in image recognition to generate more images where the distribution is similar to that of the real ones. It often introduces a discriminator network to differentiate the real data from the generated ones. Such models utilise a discriminator network tasked with differentiating style transferred data from data contained in the target dataset. However in doing so the network focuses on discrepancies in the intensity distribution and may overlook structural differences between the datasets. In this paper we formulate a new image-to-image translation problem to ensure that the structure of the generated images is similar to that in the target dataset. We propose a simple, yet powerful Structure-Unbiased Adversarial (SUA) network which accounts for both intensity and structural differences between the training and test sets when performing image segmentation. It consists of a spatial transformation block followed by an intensity distribution rendering module. The spatial transformation block is proposed to reduce the structure gap between the two images, and also produce an inverse deformation field to warp the final segmented image back. The intensity distribution rendering module then renders the deformed structure to an image with the target intensity distribution. Experimental results show that the proposed SUA method has the capability to transfer both intensity distribution and structural content between multiple datasets.