arXiv reaDer
深層学習システムのパフォーマンスに対する偽のトレーニング データの影響の分析
Analyzing Effects of Fake Training Data on the Performance of Deep Learning Systems
深層学習モデルは、クラスの不均衡や分布シフトに対するロバスト性の欠如など、さまざまな問題に悩まされることがよくあります。多くの場合、利用可能なベンチマークを超えてトレーニングに適したデータを見つけることは困難です。これは、コンピューター ビジョン モデルの場合に特に当てはまります。しかし、Generative Adversarial Networks (GAN) の出現により、高品質の合成データを生成できるようになりました。この合成データを使用して、ディープ ラーニング モデルが直面するいくつかの課題を軽減できます。この作業では、さまざまな割合の合成データと実際の (有機) データを使用してコンピューター ビジョン モデルをトレーニングする効果の詳細な分析を提示します。さまざまな量の合成データが元のデータと混合された場合に、分布外のデータに対するモデルの堅牢性と予測の一般的な品質に与える影響を分析します。
Deep learning models frequently suffer from various problems such as class imbalance and lack of robustness to distribution shift. It is often difficult to find data suitable for training beyond the available benchmarks. This is especially the case for computer vision models. However, with the advent of Generative Adversarial Networks (GANs), it is now possible to generate high-quality synthetic data. This synthetic data can be used to alleviate some of the challenges faced by deep learning models. In this work we present a detailed analysis of the effect of training computer vision models using different proportions of synthetic data along with real (organic) data. We analyze the effect that various quantities of synthetic data, when mixed with original data, can have on a model's robustness to out-of-distribution data and the general quality of predictions.
updated: Thu Mar 02 2023 13:53:22 GMT+0000 (UTC)
published: Thu Mar 02 2023 13:53:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト