arXiv reaDer
任意のスケールの画像合成
Arbitrary-Scale Image Synthesis
位置エンコーディングにより、最近の作業で、さまざまなスケールの画像を生成できる単一の敵対的ネットワークをトレーニングできるようになりました。ただし、これらのアプローチは、一連の個別のスケールに限定されるか、モデルが明示的にトレーニングされていないスケールで良好な知覚品質を維持するのに苦労します。ジェネレータのレイヤー変換に対して不変のスケール整合性のある位置エンコーディングの設計を提案します。これにより、トレーニング中に見えないスケールでも任意のスケールの画像を生成できます。さらに、パイプラインと部分生成トレーニングに新しいスケール間拡張を組み込んで、任意のスケールでの一貫した画像の合成を容易にします。最後に、画像合成に一般的に使用されるさまざまなデータセットの一連のスケールについて、競争力のある結果を示します。
Positional encodings have enabled recent works to train a single adversarial network that can generate images of different scales. However, these approaches are either limited to a set of discrete scales or struggle to maintain good perceptual quality at the scales for which the model is not trained explicitly. We propose the design of scale-consistent positional encodings invariant to our generator's layers transformations. This enables the generation of arbitrary-scale images even at scales unseen during training. Moreover, we incorporate novel inter-scale augmentations into our pipeline and partial generation training to facilitate the synthesis of consistent images at arbitrary scales. Lastly, we show competitive results for a continuum of scales on various commonly used datasets for image synthesis.
updated: Tue Apr 05 2022 15:10:43 GMT+0000 (UTC)
published: Tue Apr 05 2022 15:10:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト