最近の生成モデルは写実的な画像を生成できるため、人々は生成プロセスの背後にあるメカニズムを理解しようとしています。解釈可能な生成プロセスは、さまざまな画像編集アプリケーションにとって有益です。この作業では、任意の事前訓練された生成的敵対的ネットワークが与えられた潜在空間で解釈可能な方向を発見するためのフレームワークを提案します。さまざまな属性を表す以前のワンホットベクトルから、事前にトレーニングされたモデルで使用される潜在空間への変換を学習することを提案します。さらに、重心損失関数を適用して、さまざまな方向を移動する際の一貫性と滑らかさを向上させます。提案されたフレームワークの有効性を幅広いデータセットで示します。検出された方向ベクトルは、さまざまな異なる属性に視覚的に対応しているため、属性の編集が可能です。
As recent generative models can generate photo-realistic images, people seek to understand the mechanism behind the generation process. Interpretable generation process is beneficial to various image editing applications. In this work, we propose a framework to discover interpretable directions in the latent space given arbitrary pre-trained generative adversarial networks. We propose to learn the transformation from prior one-hot vectors representing different attributes to the latent space used by pre-trained models. Furthermore, we apply a centroid loss function to improve consistency and smoothness while traversing through different directions. We demonstrate the efficacy of the proposed framework on a wide range of datasets. The discovered direction vectors are shown to be visually corresponding to various distinct attributes and thus enable attribute editing.