arXiv reaDer
深い画像操作のためのオートエンコーダの交換
Swapping Autoencoder for Deep Image Manipulation
深い生成モデルは、ランダムにサンプリングされたシードから現実的な画像を生成するのにますます効果的になっていますが、既存の画像の制御可能な操作にそのようなモデルを使用することは、依然として困難です。ランダムサンプリングではなく、画像操作専用に設計されたディープモデルであるSwapping Autoencoderを提案します。重要なアイデアは、2つの独立したコンポーネントを使用して画像をエンコードし、入れ替えた組み合わせが現実的な画像にマッピングされるようにすることです。特に、画像のさまざまな部分にまたがる同時発生するパッチ統計を1つのコンポーネントにエンコードすることを強制することにより、コンポーネントが構造とテクスチャを表すことを推奨します。私たちの方法はエンコーダーでトレーニングされるため、新しい入力画像の潜在コードを見つけることは面倒ではなく、簡単になります。その結果、テクスチャのスワッピング、ローカルおよびグローバル編集、潜在コードベクトル演算など、さまざまな方法で実際の入力画像を操作するために使用できます。複数のデータセットの実験は、私たちのモデルがより良い結果を生成し、最近の生成モデルと比較して大幅に効率的であることを示しています。
Deep generative models have become increasingly effective at producing realistic images from randomly sampled seeds, but using such models for controllable manipulation of existing images remains challenging. We propose the Swapping Autoencoder, a deep model designed specifically for image manipulation, rather than random sampling. The key idea is to encode an image with two independent components and enforce that any swapped combination maps to a realistic image. In particular, we encourage the components to represent structure and texture, by enforcing one component to encode co-occurrent patch statistics across different parts of an image. As our method is trained with an encoder, finding the latent codes for a new input image becomes trivial, rather than cumbersome. As a result, it can be used to manipulate real input images in various ways, including texture swapping, local and global editing, and latent code vector arithmetic. Experiments on multiple datasets show that our model produces better results and is substantially more efficient compared to recent generative models.
updated: Mon Dec 14 2020 09:41:33 GMT+0000 (UTC)
published: Wed Jul 01 2020 17:59:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト