事前トレーニング済みの表現は、最新の深層学習の成功における重要な要素の 1 つです。ただし、継続的な学習方法に関する既存の研究は、ほとんどの場合、モデルをゼロから段階的に学習することに重点を置いています。このホワイトペーパーでは、事前トレーニング済みの表現からモデルを継続的に微調整する、増分学習の代替フレームワークを探ります。私たちの方法は、事前に訓練されたニューラルネットワークの線形化技術を利用して、シンプルで効果的な継続的な学習を行います。これにより、二次パラメータ正則化法を最適な継続学習ポリシーとして配置した線形モデルを設計できると同時に、ニューラル ネットワークの高いパフォーマンスを享受できることを示します。また、提案されたアルゴリズムにより、パラメーター正則化メソッドをクラスインクリメンタル問題に適用できることも示します。さらに、EWC などの既存のパラメーター空間正則化アルゴリズムがクロス エントロピー損失でトレーニングされたニューラル ネットワークでパフォーマンスが低下する理論的理由を提供します。提案された方法が、画像分類タスクで高い継続的な微調整パフォーマンスを達成しながら、忘却を防止できることを示します。私たちの方法が一般的な継続学習の設定に適用できることを示すために、データ増分、タスク増分、およびクラス増分学習問題で私たちの方法を評価します。
Pre-trained representation is one of the key elements in the success of modern deep learning. However, existing works on continual learning methods have mostly focused on learning models incrementally from scratch. In this paper, we explore an alternative framework to incremental learning where we continually fine-tune the model from a pre-trained representation. Our method takes advantage of linearization technique of a pre-trained neural network for simple and effective continual learning. We show that this allows us to design a linear model where quadratic parameter regularization method is placed as the optimal continual learning policy, and at the same time enjoying the high performance of neural networks. We also show that the proposed algorithm enables parameter regularization methods to be applied to class-incremental problems. Additionally, we provide a theoretical reason why the existing parameter-space regularization algorithms such as EWC underperform on neural networks trained with cross-entropy loss. We show that the proposed method can prevent forgetting while achieving high continual fine-tuning performance on image classification tasks. To show that our method can be applied to general continual learning settings, we evaluate our method in data-incremental, task-incremental, and class-incremental learning problems.