arXiv reaDer
LoGANv2:生成的敵対ネットワークによる条件付きスタイルベースのロゴ生成
LoGANv2: Conditional Style-Based Logo Generation with Generative Adversarial Networks
  データが高度なマルチモダリティを持つロゴ合成などのドメインは、依然として生成的敵対ネットワーク(GAN)に課題をもたらしています。最近の研究では、プログレッシブトレーニング(ProGAN)とマッピングネットワーク拡張(StyleGAN)により、高次元の問題に対するトレーニングの安定性が向上し、埋め込まれた潜在空間内の機能分離が向上することが示されています。ただし、これらのアーキテクチャでは、ネットワークの出力のシェーピングに対する制御が制限されており、ロゴ合成の場合には望ましくない特性です。この論文では、まず、以前の研究の低解像度の結果を改善し、次に合成クラス条件を使用して出力の制御性を向上させることを目的として、StyleGANアーキテクチャの条件付き拡張について検討します。さらに、そのようなクラス条件を抽出する方法は、人間の解釈可能性に焦点を当てて探求されます。ここでの課題は、本来、視覚的なロゴの特徴を定義するのが難しいという事実にあります。導入された条件付きスタイルベースのジェネレーターアーキテクチャは、2つの実験で抽出されたクラス条件でトレーニングされ、無条件モデルのパフォーマンスに関連して研究されます。結果は、無条件モデルがトレーニング分布により密接に一致する一方で、高品質の条件により、より詳細な情報を潜在空間に埋め込むことができ、より多様な出力が得られることを示しています。
Domains such as logo synthesis, in which the data has a high degree of multi-modality, still pose a challenge for generative adversarial networks (GANs). Recent research shows that progressive training (ProGAN) and mapping network extensions (StyleGAN) enable both increased training stability for higher dimensional problems and better feature separation within the embedded latent space. However, these architectures leave limited control over shaping the output of the network, which is an undesirable trait in the case of logo synthesis. This paper explores a conditional extension to the StyleGAN architecture with the aim of firstly, improving on the low resolution results of previous research and, secondly, increasing the controllability of the output through the use of synthetic class-conditions. Furthermore, methods of extracting such class conditions are explored with a focus on the human interpretability, where the challenge lies in the fact that, by nature, visual logo characteristics are hard to define. The introduced conditional style-based generator architecture is trained on the extracted class-conditions in two experiments and studied relative to the performance of an unconditional model. Results show that, whilst the unconditional model more closely matches the training distribution, high quality conditions enabled the embedding of finer details onto the latent space, leading to more diverse output.
updated: Sun Sep 22 2019 10:29:19 GMT+0000 (UTC)
published: Sun Sep 22 2019 10:29:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト