arXiv reaDer
メモリ効率の高い半教師あり継続学習:世界は独自のリプレイバッファです
Memory-Efficient Semi-Supervised Continual Learning: The World is its Own Replay Buffer
リハーサルは、クラス単位の継続的な学習にとって重要な要素ですが、かなりのメモリバジェットが必要です。私たちの仕事は、現実的で挑戦的な継続的な学習パラダイムでエージェントの環境からのラベルのないデータを活用することによって、このメモリバジェットを大幅に削減できるかどうかを調査します。具体的には、ラベル付きデータが不足しているが、エージェントの環境からの非iidラベルなしデータが豊富である、新しい半教師あり継続学習(SSCL)設定を調査して形式化します。重要なことに、SSCL設定のデータ分布は現実的であるため、ラベル付きデータ分布とラベルなしデータ分布の間のオブジェクトクラスの相関関係を反映しています。疑似ラベリング、整合性正則化、Out-of-Distribution(OoD)検出、および知識蒸留に基づいて構築された戦略が、この設定での忘却を減らすことを示します。私たちのアプローチであるDistillMatchは、SSCL CIFAR-100実験で、最先端のパフォーマンスを8.7%以上の平均タスク精度と最大54.5%の平均タスク精度で向上させます。さらに、DistillMatchは、0.08しか保存しない次善の方法と比較して、処理されたラベルなし画像ごとに最大0.23の保存画像を保存できることを示しています。私たちの結果は、現実的な相関分布に焦点を当てることは非常に新しい視点であり、継続的な学習戦略として世界の構造を活用することの重要性を強調していることを示唆しています。
Rehearsal is a critical component for class-incremental continual learning, yet it requires a substantial memory budget. Our work investigates whether we can significantly reduce this memory budget by leveraging unlabeled data from an agent's environment in a realistic and challenging continual learning paradigm. Specifically, we explore and formalize a novel semi-supervised continual learning (SSCL) setting, where labeled data is scarce yet non-i.i.d. unlabeled data from the agent's environment is plentiful. Importantly, data distributions in the SSCL setting are realistic and therefore reflect object class correlations between, and among, the labeled and unlabeled data distributions. We show that a strategy built on pseudo-labeling, consistency regularization, Out-of-Distribution (OoD) detection, and knowledge distillation reduces forgetting in this setting. Our approach, DistillMatch, increases performance over the state-of-the-art by no less than 8.7% average task accuracy and up to 54.5% average task accuracy in SSCL CIFAR-100 experiments. Moreover, we demonstrate that DistillMatch can save up to 0.23 stored images per processed unlabeled image compared to the next best method which only saves 0.08. Our results suggest that focusing on realistic correlated distributions is a significantly new perspective, which accentuates the importance of leveraging the world's structure as a continual learning strategy.
updated: Thu May 06 2021 17:55:20 GMT+0000 (UTC)
published: Sat Jan 23 2021 17:23:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト