Sampling Strategies for GAN Synthetic Data
  Generative Adversarial Networks(GAN)は、大量の合成データを生成するために広く使用されています。このデータは、深い畳み込みニューラルネットワーク(CNN)をトレーニングするために、実際の例で補強するために利用されています。研究により、生成された例には、深いCNNを訓練するのに十分なリアリズムがなく、多様性に乏しいことが示されています。合成データを実際のデータでランダムに拡張するこれまでの研究とは異なり、簡単で効果的で実装しやすい合成データサンプリング手法を使用して、ディープCNNをより効率的かつ正確にトレーニングします。この目的のために、GAN自体のトレーニング中に学習したパラメーターを最大限に活用することを提案します。これらには、識別器のリアリズム信頼性スコアと合成データのターゲットラベルに対する信頼性が含まれます。これに加えて、GAN合成データの大規模なプールから意味のある合成例のサブセットを自動的に検索する強化学習(RL)を探索します。 2つの挑戦的な顔の属性分類データセットでメソッドを評価します。 AffectNetおよびCelebA。私たちの広範な実験は、増強の前に合成データをサンプリングする必要性を明確に示しています。これにより、in vitroで最先端のディープCNNの1つのパフォーマンスも向上します。
Generative Adversarial Networks (GANs) have been used widely to generate large volumes of synthetic data. This data is being utilized for augmenting with real examples in order to train deep Convolutional Neural Networks (CNNs). Studies have shown that the generated examples lack sufficient realism to train deep CNNs and are poor in diversity. Unlike previous studies of randomly augmenting the synthetic data with real data, we present our simple, effective and easy to implement synthetic data sampling methods to train deep CNNs more efficiently and accurately. To this end, we propose to maximally utilize the parameters learned during training of the GAN itself. These include discriminator's realism confidence score and the confidence on the target label of the synthetic data. In addition to this, we explore reinforcement learning (RL) to automatically search a subset of meaningful synthetic examples from a large pool of GAN synthetic data. We evaluate our method on two challenging face attribute classification data sets viz. AffectNet and CelebA. Our extensive experiments clearly demonstrate the need of sampling synthetic data before augmentation, which also improves the performance of one of the state-of-the-art deep CNNs in vitro.
updated: Tue Sep 10 2019 18:07:32 GMT+0000 (UTC)
published: Tue Sep 10 2019 18:07:32 GMT+0000 (UTC)
