arXiv reaDer
記憶再生クラスの段階的学習のためのバランスのとれた破壊と再構築のダイナミクス
Balanced Destruction-Reconstruction Dynamics for Memory-replay Class Incremental Learning
クラス増分学習 (CIL) は、以前に学習した能力 (安定性) を維持しながら、トレーニングされたモデルをサンプルの新しいクラス (可塑性) で増分的に更新することを目的としています。この目標における最も困難な問題、つまり壊滅的な忘却に対処するための主流のパラダイムは、メモリに保存された少数の古いクラスのサンプルを再生することによって古い知識を統合するメモリ再生 CIL です。有効性にもかかわらず、メモリ再生 CIL に固有の破壊と再構築のダイナミクスには本質的な制限があります。古い知識が大幅に破壊された場合、可逆的な対応物を再構築するのは非常に困難になります。私たちの理論的分析は、現在のフェーズからのサンプルとメモリに保存されているサンプルの寄与のバランスをとることで、古い知識の破壊を効果的に軽減できることを示しています。この理論的発見に動機づけられて、我々は、古い知識の最大限の破壊の程度を減らすことによって、より良い知識の再構築を達成できる、記憶再生 CIL のための新しいバランスのとれた破壊-再構築モジュール (BDR) を提案します。具体的には、古い知識と新しいクラスの間でより良いバランスを実現するために、提案された BDR モジュールは 2 つの要素を考慮します。それは、異なるクラス間のトレーニング ステータスの分散と、現在のフェーズとメモリからのサンプルの量の不均衡です。これらの要因に基づいてトレーニング中に勾配を動的に操作することにより、BDR は知識の破壊を効果的に軽減し、知識の再構築を向上させることができます。さまざまな CIL ベンチマークに関する広範な実験により、BDR は軽量のプラグ アンド プレイ モジュールとして、優れた一般化により既存の最先端の手法のパフォーマンスを大幅に向上できることが示されました。
Class incremental learning (CIL) aims to incrementally update a trained model with the new classes of samples (plasticity) while retaining previously learned ability (stability). To address the most challenging issue in this goal, i.e., catastrophic forgetting, the mainstream paradigm is memory-replay CIL, which consolidates old knowledge by replaying a small number of old classes of samples saved in the memory. Despite effectiveness, the inherent destruction-reconstruction dynamics in memory-replay CIL are an intrinsic limitation: if the old knowledge is severely destructed, it will be quite hard to reconstruct the lossless counterpart. Our theoretical analysis shows that the destruction of old knowledge can be effectively alleviated by balancing the contribution of samples from the current phase and those saved in the memory. Motivated by this theoretical finding, we propose a novel Balanced Destruction-Reconstruction module (BDR) for memory-replay CIL, which can achieve better knowledge reconstruction by reducing the degree of maximal destruction of old knowledge. Specifically, to achieve a better balance between old knowledge and new classes, the proposed BDR module takes into account two factors: the variance in training status across different classes and the quantity imbalance of samples from the current phase and memory. By dynamically manipulating the gradient during training based on these factors, BDR can effectively alleviate knowledge destruction and improve knowledge reconstruction. Extensive experiments on a range of CIL benchmarks have shown that as a lightweight plug-and-play module, BDR can significantly improve the performance of existing state-of-the-art methods with good generalization.
updated: Thu Aug 03 2023 11:33:50 GMT+0000 (UTC)
published: Thu Aug 03 2023 11:33:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト