最新のコンピュータビジョンアプリケーションは、時間の経過とともに新しい概念を段階的に学習するときに、壊滅的な忘却に悩まされています。この忘却を軽減するための最も成功したアプローチは、以前に見たデータの大規模な再生を必要とします。これは、メモリの制約またはデータの合法性の懸念が存在する場合に問題になります。この作業では、データフリークラスインクリメンタル学習(DFCIL)の影響の大きい問題について検討します。この問題では、インクリメンタル学習エージェントは、ジェネレーターを保存したり、過去のタスクからデータをトレーニングしたりせずに、時間の経過とともに新しい概念を学習する必要があります。 DFCILの1つのアプローチは、学習者の分類モデルの凍結コピーを反転することによって生成された合成画像を再生することですが、標準的な蒸留戦略を使用する場合、このアプローチは一般的なクラス増分ベンチマークでは失敗することを示します。この失敗の原因を診断し、DFCILの新しい増分蒸留戦略を提案し、修正されたクロスエントロピートレーニングと重要度加重特徴蒸留に貢献し、私たちの方法が最終タスクの精度を最大25.1%向上させることを示します(絶対違い)一般的なクラス増分ベンチマークのSOTADFCILメソッドと比較。私たちの方法は、画像のコアセットを保存するいくつかの標準的な再生ベースの方法よりも優れています。
Modern computer vision applications suffer from catastrophic forgetting when incrementally learning new concepts over time. The most successful approaches to alleviate this forgetting require extensive replay of previously seen data, which is problematic when memory constraints or data legality concerns exist. In this work, we consider the high-impact problem of Data-Free Class-Incremental Learning (DFCIL), where an incremental learning agent must learn new concepts over time without storing generators or training data from past tasks. One approach for DFCIL is to replay synthetic images produced by inverting a frozen copy of the learner's classification model, but we show this approach fails for common class-incremental benchmarks when using standard distillation strategies. We diagnose the cause of this failure and propose a novel incremental distillation strategy for DFCIL, contributing a modified cross-entropy training and importance-weighted feature distillation, and show that our method results in up to a 25.1% increase in final task accuracy (absolute difference) compared to SOTA DFCIL methods for common class-incremental benchmarks. Our method even outperforms several standard replay based methods which store a coreset of images.