arXiv reaDer
直感的なユーザー入力からの深い画像合成:レビューと展望
Deep Image Synthesis from Intuitive User Input: A Review and Perspectives
コンピュータグラフィックス、アート、デザインの多くのアプリケーションでは、ユーザーがテキスト、スケッチ、ストローク、グラフ、レイアウトなどの直感的な非画像入力を提供し、コンピュータシステムに付着した写真のようにリアルな画像を自動的に生成させることが望ましいです。入力コンテンツに。このような自動画像コンテンツ生成を可能にする古典的な作品は、画像検索と合成のフレームワークに従いましたが、生成的敵対的ネットワーク(GAN)、変分オートエンコーダー(VAE)、フローベースの方法などの深い生成モデルの最近の進歩により、より強力になりました。用途の広い画像生成タスク。このホワイトペーパーでは、直感的なユーザー入力を前提とした画像合成の最近の作業をレビューし、入力の多様性、画像生成方法、ベンチマークデータセット、評価指標の進歩について説明します。これは、入力表現と双方向性、主要な画像生成パラダイム間の他家受粉、および生成方法の評価と比較に関する新しい視点を動機付けます。
In many applications of computer graphics, art and design, it is desirable for a user to provide intuitive non-image input, such as text, sketch, stroke, graph or layout, and have a computer system automatically generate photo-realistic images that adhere to the input content. While classic works that allow such automatic image content generation have followed a framework of image retrieval and composition, recent advances in deep generative models such as generative adversarial networks (GANs), variational autoencoders (VAEs), and flow-based methods have enabled more powerful and versatile image generation tasks. This paper reviews recent works for image synthesis given intuitive user input, covering advances in input versatility, image generation methodology, benchmark datasets, and evaluation metrics. This motivates new perspectives on input representation and interactivity, cross pollination between major image generation paradigms, and evaluation and comparison of generation methods.
updated: Fri Jul 09 2021 06:31:47 GMT+0000 (UTC)
published: Fri Jul 09 2021 06:31:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト