arXiv reaDer
BalaGAN:クロスモーダル転送による不均衡なドメイン間の画像変換
BalaGAN: Image Translation Between Imbalanced Domains via Cross-Modal Transfer
最先端の画像から画像への変換方法は、1つの画像ドメインに豊かさと多様性が欠けている不均衡なドメイン設定で苦労する傾向があります。ドメインの不均衡の問題に取り組むために特別に設計された、新しい教師なし翻訳ネットワーク、BalaGANを紹介します。よりリッチなドメインの潜在的なモダリティを活用して、2つの不均衡なドメイン間の画像から画像への変換の問題を、スタイル転送設定により似た、バランスの取れたマルチクラスの条件付き変換の問題に変えます。具体的には、ソースドメインを分析し、監視なしで、潜在的なモードまたはクラスのセットへの分解を学習します。これにより、ターゲットドメインを含むクラスのすべてのペア間で、バランスの取れた多数のクロスドメイン変換タスクが残ります。推論中、トレーニングされたネットワークは、入力としてソース画像と、モードの1つからの参照またはスタイル画像を条件として受け取り、ピクセル単位のレベルでソースに似ているが同じモードを共有する画像を生成します。参考として。データセット内でモダリティを採用すると、翻訳された画像の品質が向上し、BalaGANは、画質と多様性の点で、無条件およびスタイル転送ベースの画像から画像への翻訳方法の強力なベースラインよりも優れていることを示します。
State-of-the-art image-to-image translation methods tend to struggle in an imbalanced domain setting, where one image domain lacks richness and diversity. We introduce a new unsupervised translation network, BalaGAN, specifically designed to tackle the domain imbalance problem. We leverage the latent modalities of the richer domain to turn the image-to-image translation problem, between two imbalanced domains, into a balanced, multi-class, and conditional translation problem, more resembling the style transfer setting. Specifically, we analyze the source domain and learn a decomposition of it into a set of latent modes or classes, without any supervision. This leaves us with a multitude of balanced cross-domain translation tasks, between all pairs of classes, including the target domain. During inference, the trained network takes as input a source image, as well as a reference or style image from one of the modes as a condition, and produces an image which resembles the source on the pixel-wise level, but shares the same mode as the reference. We show that employing modalities within the dataset improves the quality of the translated images, and that BalaGAN outperforms strong baselines of both unconditioned and style-transfer-based image-to-image translation methods, in terms of image quality and diversity.
updated: Sat Jun 05 2021 14:24:50 GMT+0000 (UTC)
published: Mon Oct 05 2020 14:16:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト