近年、敵対的に学習された生成モデル(GAN)は、説得力のある画像合成結果を達成している。しかし、教師なしの表現学習にGANを使用した初期の成功にもかかわらず、GANは自己教師に基づくアプローチに取って代わられた。本研究では、画像生成品質の向上が表現学習性能の大幅な向上につながることを示す。我々のアプローチであるBigBiGANは、最先端のBigGANモデルをベースに、エンコーダを追加し、識別器を変更することで表現学習に拡張している。これらのBigBiGANモデルの表現学習と生成能力を広範囲に評価し、生成ベースのモデルがImageNet上での教師なし表現学習と無条件画像生成において最先端の技術を達成していることを実証する。
Adversarially trained generative models (GANs) have recently achieved compelling image synthesis results. But despite early successes in using GANs for unsupervised representation learning, they have since been superseded by approaches based on self-supervision. In this work we show that progress in image generation quality translates to substantially improved representation learning performance. Our approach, BigBiGAN, builds upon the state-of-the-art BigGAN model, extending it to representation learning by adding an encoder and modifying the discriminator. We extensively evaluate the representation learning and generation capabilities of these BigBiGAN models, demonstrating that these generation-based models achieve the state of the art in unsupervised representation learning on ImageNet, as well as in unconditional image generation.