arXiv reaDer
(ちょうど) 拡張を超えたデータ効率の高い GAN トレーニング: 宝くじチケットの視点
Data-Efficient GAN Training Beyond (Just) Augmentations: A Lottery Ticket Perspective
限られた実際の画像データを使用して敵対的生成ネットワーク (GAN) をトレーニングすると、通常、パフォーマンスが低下し、モデルが崩壊します。この課題を克服するために、GANから独立して訓練可能で非常にまばらなサブネットワーク(別名、宝くじチケット)を発見できるという最新の観察に触発されました。これを帰納的事前確率として扱うことで、データ効率の高い GAN トレーニングに向けたまったく新しい角度を提案します。最初に、実際の画像の小さなトレーニング セットを使用して、元の GAN から宝くじを識別します。次に、同じセットを再利用することで、その疎なサブネットワークのトレーニングに焦点を当てます。どちらのステップも複雑性が低く、トレーニングのデータ効率が高くなります。既存の実画像データ拡張方法に直交ゲインを提供する調整されたフレームワークを見つけ、さらにそれらと一緒に適用できる新しい機能レベル拡張を提供します。包括的な実験により、さまざまな GAN アーキテクチャ (SNGAN、BigGAN、および StyleGAN-V2) およびさまざまなデータセット (CIFAR-10、CIFAR-100、Tiny-ImageNet、および ImageNet) 全体で、提案されたフレームワークの有効性が保証されます。私たちのトレーニング フレームワークは、強力な数ショットの一般化能力も示しています。つまり、事前トレーニングなしで、わずか 100 個の実際の画像を使用してゼロからトレーニングすることで、忠実度の高い画像を生成します。コードは https://github.com/VITA-Group/Ultra-Data-Efficient-GAN-Training で入手できます。
Training generative adversarial networks (GANs) with limited real image data generally results in deteriorated performance and collapsed models. To conquer this challenge, we are inspired by the latest observations, that one can discover independently trainable and highly sparse subnetworks (a.k.a., lottery tickets) from GANs. Treating this as an inductive prior, we suggest a brand-new angle towards data-efficient GAN training: by first identifying the lottery ticket from the original GAN using the small training set of real images; and then focusing on training that sparse subnetwork by re-using the same set. Both steps have lower complexity and are more data-efficient to train. We find our coordinated framework to offer orthogonal gains to existing real image data augmentation methods, and we additionally offer a new feature-level augmentation that can be applied together with them. Comprehensive experiments endorse the effectiveness of our proposed framework, across various GAN architectures (SNGAN, BigGAN, and StyleGAN-V2) and diverse datasets (CIFAR-10, CIFAR-100, Tiny-ImageNet, and ImageNet). Our training framework also displays powerful few-shot generalization ability, i.e., generating high-fidelity images by training from scratch with just 100 real images, without any pre-training. Codes are available at: https://github.com/VITA-Group/Ultra-Data-Efficient-GAN-Training.
updated: Sat May 29 2021 04:57:31 GMT+0000 (UTC)
published: Sun Feb 28 2021 05:20:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト