この作品は、オブジェクトの複数のクラスを含む画像を生成するための新しいシステムを紹介します。 Generative Adversarial Networksの最近の研究では高品質の画像が生成されていますが、多くの場合、単一のオブジェクトまたはオブジェクトのセットの画像の生成に焦点が当てられています。私たちのシステムは、単一の画像に含まれる望ましいクラスのリストを条件とする画像生成のタスクに対処します。これにより、システムはオブジェクトの任意の組み合わせで画像を生成し、すべて視覚的にリアルな自然画像に合成することができます。システムは、データセットで表されるすべてのクラスの相互関係を学習し、これらのクラスのセットを含む多様なサンプルを生成できます。複雑な自然画像を特徴付ける遮蔽およびオブジェクト間の空間関係を考慮して、これらのオブジェクトを一緒に配置する機能を表示します。これを達成するために、モードと条件の両方に対して崩壊に対して安定化される条件付きディープコンボリューショナルGANに基づく新しいアーキテクチャを導入します。システムは、トレーニング中にモードの崩壊を修正することを学習し、最適でない生成モードを回避するために自己修正します。
This work introduces a novel system for the generation of images that contain multiple classes of objects. Recent work in Generative Adversarial Networks have produced high quality images, but many focus on generating images of a single object or set of objects. Our system addresses the task of image generation conditioned on a list of desired classes to be included in a single image. This enables our system to generate images with any given combination of objects, all composed into a visually realistic natural image. The system learns the interrelationships of all classes represented in a dataset, and can generate diverse samples including a set of these classes. It displays the ability to arrange these objects together, accounting for occlusions and inter-object spatial relations that characterize complex natural images. To accomplish this, we introduce a novel architecture based on Conditional Deep Convolutional GANs that is stabilized against collapse relative to both mode and condition. The system learns to rectify mode collapse during training, self-correcting to avoid suboptimal generation modes.