最近の研究では、事前に訓練された生成的敵対的ネットワーク(GAN)の潜在空間で解釈可能な方向を見つけることが可能であることが示されています。これらの方向により、制御可能な画像生成が可能になり、ズームや回転などの幅広いセマンティック編集操作がサポートされます。このような方向の発見は、多くの場合、監視ありまたは半監視ありの方法で行われ、実際の使用を制限する手動の注釈が必要です。対照的に、教師なし発見では、事前に検出するのが難しい微妙な方向を見つけることができます。この作業では、自己教師ありの方法で事前に訓練されたGANの潜在空間で意味方向を発見するための対照的な学習ベースのアプローチを提案します。私たちのアプローチは、最先端の方法に匹敵する意味的に意味のある次元を見つけます。
Recent research has shown that it is possible to find interpretable directions in the latent spaces of pre-trained Generative Adversarial Networks (GANs). These directions enable controllable image generation and support a wide range of semantic editing operations, such as zoom or rotation. The discovery of such directions is often done in a supervised or semi-supervised manner and requires manual annotations which limits their use in practice. In comparison, unsupervised discovery allows finding subtle directions that are difficult to detect a priori. In this work, we propose a contrastive learning-based approach to discover semantic directions in the latent space of pre-trained GANs in a self-supervised manner. Our approach finds semantically meaningful dimensions comparable with state-of-the-art methods.