arXiv reaDer
リハーサルベースの継続学習のためのオンラインコアセットの選択
Online Coreset Selection for Rehearsal-based Continual Learning
データセットは、タスクを説明するための重要な証拠の断片です。ただし、データセット内の各データポイントには同じ可能性はありません。一部のデータポイントは、他のデータポイントよりも代表的または有益である可能性があるためです。データポイント間のこの不平等な重要性は、リハーサルベースの継続学習に大きな影響を与える可能性があります。リハーサルでは、トレーニング例のサブセット(コアセット)を保存して、後で再生し、壊滅的な忘却を軽減します。継続学習では、コアセットに保存されているサンプルの品質がモデルの有効性と効率に直接影響します。コアセットの選択の問題は、不均衡な継続学習やノイズの多いデータシナリオなど、現実的な設定ではさらに重要になります。この問題に取り組むために、オンラインコアセット選択(OCS)を提案します。これは、各反復で最も代表的で有益なコアセットを選択し、オンラインでトレーニングするシンプルで効果的な方法です。私たちの提案する方法は、過去のタスクへの高親和性サンプルを選択しながら、現在のデータセットへのモデルの適応を最大化し、壊滅的な忘却を直接抑制します。強力な継続学習ベースラインに対して、さまざまな標準、不均衡、およびノイズの多いデータセットに対するコアセット選択メカニズムの有効性を検証し、タスクの適応を改善し、サンプル効率の高い方法で壊滅的な忘却を防ぐことを示します。
A dataset is a shred of crucial evidence to describe a task. However, each data point in the dataset does not have the same potential, as some of the data points can be more representative or informative than others. This unequal importance among the data points may have a large impact in rehearsal-based continual learning, where we store a subset of the training examples (coreset) to be replayed later to alleviate catastrophic forgetting. In continual learning, the quality of the samples stored in the coreset directly affects the model's effectiveness and efficiency. The coreset selection problem becomes even more important under realistic settings, such as imbalanced continual learning or noisy data scenarios. To tackle this problem, we propose Online Coreset Selection (OCS), a simple yet effective method that selects the most representative and informative coreset at each iteration and trains them in an online manner. Our proposed method maximizes the model's adaptation to a current dataset while selecting high-affinity samples to past tasks, which directly inhibits catastrophic forgetting. We validate the effectiveness of our coreset selection mechanism over various standard, imbalanced, and noisy datasets against strong continual learning baselines, demonstrating that it improves task adaptation and prevents catastrophic forgetting in a sample-efficient manner.
updated: Wed Feb 23 2022 11:54:04 GMT+0000 (UTC)
published: Wed Jun 02 2021 11:39:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト