arXiv reaDer
微分可能なシャム増強によるデータセット凝縮
Dataset Condensation with Differentiable Siamese Augmentation
多くの機械学習の問題では、大規模なデータセットが、重い計算負荷を犠牲にして最先端のディープネットワークをトレーニングするための事実上の標準になっています。このホワイトペーパーでは、パフォーマンスの低下を最小限に抑えてディープニューラルネットワークをゼロからトレーニングするために使用できる、大きなトレーニングセットを非常に小さな合成セットに凝縮することに焦点を当てています。最近のトレーニングセットの合成方法から着想を得て、データ拡張を効果的に使用してより有益な合成画像を合成できるようにする微分可能シャム拡張を提案します。これにより、拡張を使用してネットワークをトレーニングする際のパフォーマンスが向上します。複数の画像分類ベンチマークでの実験は、提案された方法がCIFAR10およびCIFAR100データセットの最先端の7%の改善を大幅に上回っていることを示しています。私たちの方法がMNIST、FashionMNIST、SVHN、CIFAR10でそれぞれ99.6%、94.9%、88.5%、71.5%の相対パフォーマンスを達成していることを1%未満のデータで示しています。また、継続的な学習と神経構造の検索における私たちの方法の使用を探求し、有望な結果を示します。
In many machine learning problems, large-scale datasets have become the de-facto standard to train state-of-the-art deep networks at the price of heavy computation load. In this paper, we focus on condensing large training sets into significantly smaller synthetic sets which can be used to train deep neural networks from scratch with minimum drop in performance. Inspired from the recent training set synthesis methods, we propose Differentiable Siamese Augmentation that enables effective use of data augmentation to synthesize more informative synthetic images and thus achieves better performance when training networks with augmentations. Experiments on multiple image classification benchmarks demonstrate that the proposed method obtains substantial gains over the state-of-the-art, 7% improvements on CIFAR10 and CIFAR100 datasets. We show with only less than 1% data that our method achieves 99.6%, 94.9%, 88.5%, 71.5% relative performance on MNIST, FashionMNIST, SVHN, CIFAR10 respectively. We also explore the use of our method in continual learning and neural architecture search, and show promising results.
updated: Thu Jun 10 2021 08:04:29 GMT+0000 (UTC)
published: Tue Feb 16 2021 16:32:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト