arXiv reaDer
This dataset does not exist: training models from generated images
 現在の生成ネットワークは、高解像度の現実的な画像の生成にますます熟練しています。これらの生成ネットワーク、特に条件付きネットワークは、新しい画像データセットを提供するための優れたツールになる可能性があります。これにより、当然、生成されたデータのみで分類器をトレーニングできますか?ほぼ無制限の量のトレーニングデータのこの潜在的な可用性は、機械学習モデルをトレーニングするための標準的なプラクティスに挑戦しています。これは、長年にわたって制限された固定サイズのデータセット用に作成されてきました。この作業では、この質問とそれに関連する課題を調査します。通常のヒューリスティックを使用して、ランダムに生成された画像の単純なトレーニングよりもパフォーマンスを大幅に向上させる方法を特定します。パイプラインのさまざまな段階で適用できる3つのスタンドアロンの手法、つまりデータ生成、生成されたデータのトレーニング、実際のデータへの展開を提案します。 ImageNetデータセットのサブセットで提案されたアプローチを評価し、実際の画像で訓練された分類器と比較して有望な結果を示します。
Current generative networks are increasingly proficient in generating high-resolution realistic images. These generative networks, especially the conditional ones, can potentially become a great tool for providing new image datasets. This naturally brings the question: Can we train a classifier only on the generated data? This potential availability of nearly unlimited amounts of training data challenges standard practices for training machine learning models, which have been crafted across the years for limited and fixed size datasets. In this work we investigate this question and its related challenges. We identify ways to improve significantly the performance over naive training on randomly generated images with regular heuristics. We propose three standalone techniques that can be applied at different stages of the pipeline, i.e., data generation, training on generated data, and deploying on real data. We evaluate our proposed approaches on a subset of the ImageNet dataset and show encouraging results compared to classifiers trained on real images.
updated: Thu Nov 07 2019 13:23:39 GMT+0000 (UTC)
published: Thu Nov 07 2019 13:23:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト