arXiv reaDer
SS-IL:インクリメンタル学習用の分離されたSoftmax
SS-IL: Separated Softmax for Incremental Learning
クラス増分学習(CIL)の問題を検討します。この問題では、学習エージェントは、増分的に到着するトレーニングデータバッチから新しいクラスを継続的に学習し、これまでに学習したすべてのクラスを適切に予測することを目的としています。問題の主な課題は壊滅的な忘却であり、模範記憶ベースのCILメソッドの場合、忘却は一般に、新しいクラスと古いクラス(エグザンプラメモリ内)。スコアの再スケーリングやバランスの取れた微調整など、いくつかの追加の後処理によってそのようなスコアの偏りを修正するためのいくつかの方法が提案されていますが、そのような偏りの根本原因に関する体系的な分析は行われていません。そのために、すべての新旧のクラスの出力スコアを組み合わせてソフトマックス確率を計算することが、バイアスの主な原因である可能性があることを分析します。次に、このようなバイアスを解決するために、分離ソフトマックス(SS)出力層とタスクワイズ知識蒸留(TKD)を組み合わせた、インクリメンタル学習用分離ソフトマックス(SS-IL)と呼ばれる新しい方法を提案します。いくつかの大規模なCILベンチマークデータセットに関する広範な実験結果を通じて、SS-ILが、追加の後処理なしで、新旧のクラス間ではるかにバランスの取れた予測スコアを達成することにより、強力な最先端の精度を達成することを示します。
We consider class incremental learning (CIL) problem, in which a learning agent continuously learns new classes from incrementally arriving training data batches and aims to predict well on all the classes learned so far. The main challenge of the problem is the catastrophic forgetting, and for the exemplar-memory based CIL methods, it is generally known that the forgetting is commonly caused by the classification score bias that is injected due to the data imbalance between the new classes and the old classes (in the exemplar-memory). While several methods have been proposed to correct such score bias by some additional post-processing, e.g., score re-scaling or balanced fine-tuning, no systematic analysis on the root cause of such bias has been done. To that end, we analyze that computing the softmax probabilities by combining the output scores for all old and new classes could be the main cause of the bias. Then, we propose a new method, dubbed as Separated Softmax for Incremental Learning (SS-IL), that consists of separated softmax (SS) output layer combined with task-wise knowledge distillation (TKD) to resolve such bias. Throughout our extensive experimental results on several large-scale CIL benchmark datasets, we show our SS-IL achieves strong state-of-the-art accuracy through attaining much more balanced prediction scores across old and new classes, without any additional post-processing.
updated: Tue Jun 21 2022 06:19:45 GMT+0000 (UTC)
published: Tue Mar 31 2020 04:36:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト