画像から画像への翻訳における最近の進歩により、単一のネットワークを介して多様な画像を生成するアプローチが増加しています。 1対多マッピングのターゲットドメインを示すために、潜在コードがジェネレーターネットワークに挿入されます。ただし、正規化戦略のため、注入法はモードの崩壊につながることがわかりました。既存の正規化戦略は、機能分布の不整合を引き起こすか、潜在コードの影響を排除する可能性があります。これらの問題を解決するために、マルチマッピングモデルを設計するための多様性基準内の一貫性を提案します。基準に基づいて、潜在コード情報を注入するための中央バイアス正規化を提案します。実験により、この方法により、StarGAN、BicycleGAN、pix2pixなどの既存の画像間変換モデルの品質と多様性を改善できることが示されています。
Recent advances in image-to-image translation have seen a rise in approaches generating diverse images through a single network. To indicate the target domain for a one-to-many mapping, the latent code is injected into the generator network. However, we found that the injection method leads to mode collapse because of normalization strategies. Existing normalization strategies might either cause the inconsistency of feature distribution or eliminate the effect of the latent code. To solve these problems, we propose the consistency within diversity criteria for designing the multi-mapping model. Based on the criteria, we propose central biasing normalization to inject the latent code information. Experiments show that our method can improve the quality and diversity of existing image-to-image translation models, such as StarGAN, BicycleGAN, and pix2pix.