潜在空間の解きほぐされた表現を学ぶことは、コンピュータビジョンで研究された最も基本的な問題の1つになっています。最近、多くの生成的敵対的ネットワーク(GAN)が、忠実度の高い画像を生成する上で有望な結果を示しています。ただし、事前にトレーニングされたモデルの潜在空間のセマンティックレイアウトを理解するための研究はまだ限られています。いくつかの作品は、条件付きGANをトレーニングして、必要なセマンティック属性を持つ顔を生成します。残念ながら、これらの試みでは、生成された出力は、最先端のモデルほど写実的ではないことがよくあります。さらに、忠実度の高い画像を生成するには、大量の計算リソースと特定のデータセットも必要です。私たちの仕事では、事前にトレーニングされたGANモデルの豊富な潜在空間上でマルコフ決定過程(MDP)を定式化し、定義されたID境界の下で特定の属性に沿ったセマンティック操作の条件付きポリシーを学習しました。さらに、潜在空間の局所線形近似を使用して、意味論的年齢操作スキームを定義しました。結果は、私たちが学んだポリシーが、必要な年齢の変化を伴う忠実度の高い画像をサンプリングできると同時に、人物のアイデンティティを維持できることを示しています。
Learning a disentangled representation of the latent space has become one of the most fundamental problems studied in computer vision. Recently, many generative adversarial networks (GANs) have shown promising results in generating high fidelity images. However, studies to understand the semantic layout of the latent space of pre-trained models are still limited. Several works train conditional GANs to generate faces with required semantic attributes. Unfortunately, in these attempts often the generated output is not as photo-realistic as the state of the art models. Besides, they also require large computational resources and specific datasets to generate high fidelity images. In our work, we have formulated a Markov Decision Process (MDP) over the rich latent space of a pre-trained GAN model to learn a conditional policy for semantic manipulation along specific attributes under defined identity bounds. Further, we have defined a semantic age manipulation scheme using a locally linear approximation over the latent space. Results show that our learned policy can sample high fidelity images with required age variations, while at the same time preserve the identity of the person.