この論文では、小さな前景領域のみが与えられた場合に、現実的で多様な背景のセットを生成する問題を研究します。このタスクを画像の塗りつぶしと呼びます。このタスクの技術的な課題は、もっともらしいだけでなく、多様な画像出力も合成することです。従来の生成的敵対ネットワークはモード崩壊の影響を受けます。最近のアプローチは、生成されたサンプル間のペアワイズ距離を潜在距離に関して最大化または維持することを提案していますが、異なる条件付き入力の多様なサンプルの崩壊を明示的に防止していません。したがって、条件合成での多様なサンプリングを促進するための新しい正規化手法を提案します。さらに、画質を改善するために、特徴ピラミッド識別器を提案します。私たちの実験結果は、CelebA顔データセットとCityscapeシーンデータセットの両方で、最新のアプローチと比較して、視覚品質を犠牲にすることなく、モデルがより多様な画像を生成できることを示しています。
In this paper, we study the problem of generating a set ofrealistic and diverse backgrounds when given only a smallforeground region. We refer to this task as image outpaint-ing. The technical challenge of this task is to synthesize notonly plausible but also diverse image outputs. Traditionalgenerative adversarial networks suffer from mode collapse.While recent approaches propose to maximize orpreserve the pairwise distance between generated sampleswith respect to their latent distance, they do not explicitlyprevent the diverse samples of different conditional inputsfrom collapsing. Therefore, we propose a new regulariza-tion method to encourage diverse sampling in conditionalsynthesis. In addition, we propose a feature pyramid dis-criminator to improve the image quality. Our experimen-tal results show that our model can produce more diverseimages without sacrificing visual quality compared to state-of-the-arts approaches in both the CelebA face dataset and the Cityscape scene dataset.