GANなどの生成画像モデリング手法は、非常に説得力のある画像生成結果を示します。ただし、目的の結果を得るには、ユーザーの操作が必要になることがよくあります。既存の試みは対話性を追加しますが、調整されたアーキテクチャまたは追加のデータのいずれかを必要とします。生成画像モデリングの潜在的なベクトル空間をユーザーが直接探索および検索できるようにする最適化手法を紹介します。私たちのシステムは、潜在ベクトル空間をサンプリングすることによって複数の候補を提供し、ユーザーは複数のスライダーを使用して部分空間内の最適なブレンドの重みを選択します。さらに、ユーザーは画像編集ツールを使用して意図を表現できます。システムは、入力に基づいて潜在ベクトルをサンプリングし、新しい候補をユーザーに繰り返し提示します。私たちの定式化の利点は、専門のアーキテクチャやデータを開発せずに、任意の事前トレーニング済みモデルに私たちの方法を適用できることです。さまざまな生成画像モデリングアプリケーションを使用して手法を示し、従来のiGANとの比較ユーザー調査で優れたパフォーマンスを示しています。
Generative image modeling techniques such as GAN demonstrate highly convincing image generation result. However, user interaction is often necessary to obtain the desired results. Existing attempts add interactivity but require either tailored architectures or extra data. We present a human-in-the-optimization method that allows users to directly explore and search the latent vector space of generative image modeling. Our system provides multiple candidates by sampling the latent vector space, and the user selects the best blending weights within the subspace using multiple sliders. In addition, the user can express their intention through image editing tools. The system samples latent vectors based on inputs and presents new candidates to the user iteratively. An advantage of our formulation is that one can apply our method to arbitrary pre-trained model without developing specialized architecture or data. We demonstrate our method with various generative image modeling applications, and show superior performance in a comparative user study with prior art iGAN.