arXiv reaDer
Generative Adversarial Networks による教師なし画像変換学習
Unsupervised Image Transformation Learning via Generative Adversarial Networks
この作業では、ラベル付けされていない画像のコレクションから基になる変換 (季節の遷移など) を学習することを目的とした画像変換問題を研究します。ただし、現実の世界には無数の変換が存在する可能性があり、特に監視されていない環境では、そのようなタスクは非常に困難になります。この障害に取り組むために、弁別器と生成器が変換空間を共有する敵対的生成ネットワーク (GAN) 上に構築された新しい学習フレームワークを提案します。モデルが完全に最適化された後、共有スペース内の任意の 2 つのポイントが有効な変換を定義することが期待されます。このようにして、推論段階で、両方の画像を変換空間に射影することにより、カスタマイズ可能な画像ペア間の変動要因を適切に抽出することができます。結果として得られる変換ベクトルは、画像合成をさらにガイドし、継続的なセマンティックな変化を伴う画像編集を容易にします (たとえば、秋を中間ステップとして夏を冬に変更するなど)。学習された変換空間は、イメージ スタイルの転送 (昼から夜への変更など) だけでなく、イメージ コンテンツの操作 (空に雲を追加するなど) もサポートしていることに注目してください。さらに、さまざまな変換がどのように構成されているかを理解するために、変換空間の特性を詳細に分析します。プロジェクト ページは https://genforce.github.io/trgan/ です。
In this work, we study the image transformation problem, which targets at learning the underlying transformations (e.g., the transition of seasons) from a collection of unlabeled images. However, there could be countless of transformations in the real world, making such a task incredibly challenging, especially under the unsupervised setting. To tackle this obstacle, we propose a novel learning framework built on generative adversarial networks (GANs), where the discriminator and the generator share a transformation space. After the model gets fully optimized, any two points within the shared space are expected to define a valid transformation. In this way, at the inference stage, we manage to adequately extract the variation factor between a customizable image pair by projecting both images onto the transformation space. The resulting transformation vector can further guide the image synthesis, facilitating image editing with continuous semantic change (e.g., altering summer to winter with fall as the intermediate step). Noticeably, the learned transformation space supports not only transferring image styles (e.g., changing day to night), but also manipulating image contents (e.g., adding clouds in the sky). In addition, we make in-depth analysis on the properties of the transformation space to help understand how various transformations are organized. Project page is at https://genforce.github.io/trgan/.
updated: Wed Oct 05 2022 18:01:19 GMT+0000 (UTC)
published: Sat Mar 13 2021 17:08:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト