arXiv reaDer
画像の合成による生成的階層的特徴
Generative Hierarchical Features from Synthesizing Images
生成的敵対的ネットワーク(GAN)は最近、観測データの基礎となる分布を学習することにより、画像合成を進歩させました。ただし、画像生成のタスクを解決することから学んだ機能が他の視覚タスクにどのように適用できるかについては、ほとんど調査されていません。この作品では、画像を合成することを学ぶことで、幅広いアプリケーションで一般化できる注目に値する階層的な視覚的特徴をもたらすことができることを示します。具体的には、事前にトレーニングされたStyleGANジェネレーターを学習された損失関数と見なし、そのレイヤーごとの表現を利用して、新しい階層エンコーダーをトレーニングします。 Generative Hierarchical Feature(GH-Feat)と呼ばれる、当社のエンコーダーによって生成された視覚的特徴は、画像編集、画像調和、画像分類、顔検証、ランドマーク検出、レイアウト予測など、生成タスクと識別タスクの両方に強力に転送できます。広範な定性的および定量的実験結果は、GH-Featの魅力的なパフォーマンスを示しています。
Generative Adversarial Networks (GANs) have recently advanced image synthesis by learning the underlying distribution of the observed data. However, how the features learned from solving the task of image generation are applicable to other vision tasks remains seldom explored. In this work, we show that learning to synthesize images can bring remarkable hierarchical visual features that are generalizable across a wide range of applications. Specifically, we consider the pre-trained StyleGAN generator as a learned loss function and utilize its layer-wise representation to train a novel hierarchical encoder. The visual feature produced by our encoder, termed as Generative Hierarchical Feature (GH-Feat), has strong transferability to both generative and discriminative tasks, including image editing, image harmonization, image classification, face verification, landmark detection, and layout prediction. Extensive qualitative and quantitative experimental results demonstrate the appealing performance of GH-Feat.
updated: Sat Apr 03 2021 13:21:08 GMT+0000 (UTC)
published: Mon Jul 20 2020 18:04:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト