敵対的に訓練された生成モデル(GAN)は、最近、魅力的な画像合成結果を達成しました。しかし、教師なし表現学習にGANを使用する初期の成功にもかかわらず、それらは自己監視に基づくアプローチに取って代わられました。この作業では、画像生成品質の向上が、表現学習のパフォーマンスを大幅に向上させることを示しています。私たちのアプローチであるBigBiGANは、最先端のBigGANモデルに基づいており、エンコーダーを追加して弁別器を変更することで表現学習に拡張します。これらのBigBiGANモデルの表現学習および生成機能を広範に評価し、これらの世代ベースのモデルが、無条件の画像生成だけでなく、ImageNetでの教師なし表現学習で最先端を達成することを実証します。 TensorFlow Hub(https://tfhub.dev/s?publisher=deepmind&q=bigbigan)で、事前生成されたBigBiGANモデル(イメージジェネレーターとエンコーダーを含む)を利用できます。
Adversarially trained generative models (GANs) have recently achieved compelling image synthesis results. But despite early successes in using GANs for unsupervised representation learning, they have since been superseded by approaches based on self-supervision. In this work we show that progress in image generation quality translates to substantially improved representation learning performance. Our approach, BigBiGAN, builds upon the state-of-the-art BigGAN model, extending it to representation learning by adding an encoder and modifying the discriminator. We extensively evaluate the representation learning and generation capabilities of these BigBiGAN models, demonstrating that these generation-based models achieve the state of the art in unsupervised representation learning on ImageNet, as well as in unconditional image generation. Pretrained BigBiGAN models -- including image generators and encoders -- are available on TensorFlow Hub (https://tfhub.dev/s?publisher=deepmind&q=bigbigan).