arXiv reaDer
高忠実度画像合成のための階層構成GAN
Hierarchy Composition GAN for High-fidelity Image Synthesis
近年の画像合成における生成的敵対的ネットワーク(GAN)の急速な進歩にもかかわらず、既存の画像合成アプローチは、ジオメトリドメインまたは外観ドメインのいずれかでのみ機能し、さまざまな合成アーティファクトをもたらすことがよくあります。このホワイトペーパーでは、ジオメトリと外観のドメインでの画像合成をエンドツーエンドのトレーニング可能なネットワークに組み込み、両方のドメインで同時に優れた合成リアリズムを実現する革新的な階層構成GAN(HIC-GAN)を紹介します。複数の前景オブジェクトが画像合成に関与している間に、現実的な合成ジオメトリを学習し、オクルージョンを処理できる革新的な階層合成メカニズムを設計します。さらに、前景オブジェクトの外観を適応させるためのガイドとなる新しいアテンションマスクメカニズムを紹介します。これは、ジオメトリドメインで学習するためのより良いトレーニングリファレンスを提供するのにも役立ちます。シーンテキスト画像合成、ポートレート編集、屋内レンダリングタスクに関する広範な実験により、提案されたHIC-GANが定性的および定量的に優れた合成パフォーマンスを達成することが示されています。
Despite the rapid progress of generative adversarial networks (GANs) in image synthesis in recent years, the existing image synthesis approaches work in either geometry domain or appearance domain alone which often introduces various synthesis artifacts. This paper presents an innovative Hierarchical Composition GAN (HIC-GAN) that incorporates image synthesis in geometry and appearance domains into an end-to-end trainable network and achieves superior synthesis realism in both domains simultaneously. We design an innovative hierarchical composition mechanism that is capable of learning realistic composition geometry and handling occlusions while multiple foreground objects are involved in image composition. In addition, we introduce a novel attention mask mechanism that guides to adapt the appearance of foreground objects which also helps to provide better training reference for learning in geometry domain. Extensive experiments on scene text image synthesis, portrait editing and indoor rendering tasks show that the proposed HIC-GAN achieves superior synthesis performance qualitatively and quantitatively.
updated: Sat Jan 09 2021 15:32:17 GMT+0000 (UTC)
published: Sun May 12 2019 11:11:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト