arXiv reaDer
GANにおける潜在意味論の閉形式の因数分解
Closed-Form Factorization of Latent Semantics in GANs
画像を合成するために訓練された生成的敵対的ネットワーク(GAN)の潜在空間に、解釈可能な次元の豊富なセットが出現することが示されています。画像編集のためにそのような潜在的な次元を識別するために、以前の方法は通常、合成されたサンプルのコレクションに注釈を付け、潜在空間で線形分類器を訓練します。ただし、ターゲット属性の明確な定義と対応する手動の注釈が必要であり、実際のアプリケーションが制限されます。この作業では、GANによって学習された内部表現を調べて、教師なしの方法で根本的な変動要因を明らかにします。特に、GANの生成メカニズムを詳しく調べ、事前にトレーニングされた重みを直接分解することにより、潜在的意味発見のための閉形式の因数分解アルゴリズムをさらに提案します。非常に高速な実装により、私たちのアプローチは、最先端の教師あり手法に匹敵する意味的に意味のある次元を見つけることができるだけでなく、幅広いデータセットでトレーニングされた複数のGANモデルにわたってはるかに用途の広い概念をもたらします。 。
A rich set of interpretable dimensions has been shown to emerge in the latent space of the Generative Adversarial Networks (GANs) trained for synthesizing images. In order to identify such latent dimensions for image editing, previous methods typically annotate a collection of synthesized samples and train linear classifiers in the latent space. However, they require a clear definition of the target attribute as well as the corresponding manual annotations, limiting their applications in practice. In this work, we examine the internal representation learned by GANs to reveal the underlying variation factors in an unsupervised manner. In particular, we take a closer look into the generation mechanism of GANs and further propose a closed-form factorization algorithm for latent semantic discovery by directly decomposing the pre-trained weights. With a lightning-fast implementation, our approach is capable of not only finding semantically meaningful dimensions comparably to the state-of-the-art supervised methods, but also resulting in far more versatile concepts across multiple GAN models trained on a wide range of datasets.
updated: Sat Apr 03 2021 13:30:22 GMT+0000 (UTC)
published: Mon Jul 13 2020 18:05:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト