画像合成の新たに開発された分野として、単一のサンプルから画像を生成することは、大きな注目を集めています。本論文では、この問題を単一画像の条件付き分布からのサンプリングとして定式化し、構造、セマンティクス、テクスチャに関する分布の連続学習を通じて複雑な条件付き分布の学習を簡素化する階層フレームワークを提案し、プロセスを作成します。理解しやすい学習と生成の。これに基づいて、3つのカスケードGANで構成されるExSinGANを設計し、特定の画像から説明可能な生成モデルを学習します。カスケードGANは、構造、セマンティクス、テクスチャに関する分布を連続してモデル化します。 ExSinGANは、前の作品のように与えられた画像の内部パッチからだけでなく、GAN反転技術によって得られた外部の事前情報からも学習されます。 ExSinGANは、内部情報と外部情報の適切な組み合わせの恩恵を受けて、以前の作品と比較して、画像操作タスクの生成能力と競争力のある一般化能力を備えています。
Generating images from a single sample, as a newly developing branch of image synthesis, has attracted extensive attention. In this paper, we formulate this problem as sampling from the conditional distribution of a single image, and propose a hierarchical framework that simplifies the learning of the intricate conditional distributions through the successive learning of the distributions about structure, semantics and texture, making the process of learning and generation comprehensible. On this basis, we design ExSinGAN composed of three cascaded GANs for learning an explainable generative model from a given image, where the cascaded GANs model the distributions about structure, semantics and texture successively. ExSinGAN is learned not only from the internal patches of the given image as the previous works did, but also from the external prior obtained by the GAN inversion technique. Benefiting from the appropriate combination of internal and external information, ExSinGAN has a more powerful capability of generation and competitive generalization ability for the image manipulation tasks compared with prior works.