arXiv reaDer
DREAM: 代表マッチングによる効率的なデータセット抽出
DREAM: Efficient Dataset Distillation by Representative Matching
データセット蒸留は、ストレージとトレーニングのコストを削減するために、大規模なデータセットとして情報の損失がほとんどない小さなデータセットを生成することを目的としています。最近の最先端の方法は、主に、勾配、埋め込み分布、またはトレーニング軌道に関して合成画像と元の画像を照合することにより、サンプル生成プロセスを制約します。マッチングの目的はさまざまですが、現状では原画像の選択方法はナイーブランダムサンプリングに限定されています。ランダム サンプリングには必然的に決定境界付近のサンプルが含まれ、大きなまたはノイズの多い一致ターゲットが提供される可能性があると主張します。さらに、ランダム サンプリングは、サンプル分布の均一性と多様性を保証できません。これらの要因が相まって、最適化の振動が大きくなり、マッチング効率が低下します。したがって、代表的な元の画像のみがマッチングのために選択される、REpresentAtive Matching (DREAM) によるデータセット蒸留と呼ばれる新しいマッチング戦略を提案します。 DREAM は、一般的なデータセット蒸留フレームワークに簡単にプラグインでき、パフォーマンスを低下させることなく、一致する反復を 10 倍削減できます。十分なトレーニング時間があれば、DREAM はさらに大幅な改善を提供し、最先端のパフォーマンスを実現します。
Dataset distillation aims to generate small datasets with little information loss as large-scale datasets for reducing storage and training costs. Recent state-of-the-art methods mainly constrain the sample generation process by matching synthetic images and the original ones regarding gradients, embedding distributions, or training trajectories. Although there are various matching objectives, currently the method for selecting original images is limited to naive random sampling. We argue that random sampling inevitably involves samples near the decision boundaries, which may provide large or noisy matching targets. Besides, random sampling cannot guarantee the evenness and diversity of the sample distribution. These factors together lead to large optimization oscillations and degrade the matching efficiency. Accordingly, we propose a novel matching strategy named as Dataset distillation by REpresentAtive Matching (DREAM), where only representative original images are selected for matching. DREAM is able to be easily plugged into popular dataset distillation frameworks and reduce the matching iterations by 10 times without performance drop. Given sufficient training time, DREAM further provides significant improvements and achieves state-of-the-art performances.
updated: Tue Feb 28 2023 08:48:45 GMT+0000 (UTC)
published: Tue Feb 28 2023 08:48:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト