arXiv reaDer
インクリメンタルランク更新によるインクリメンタルタスク学習
Incremental Task Learning with Incremental Rank Updates
インクリメンタルタスク学習(ITL)は、複数のタスクに対して単一のネットワークを(次々に)トレーニングすることを目的とした継続学習のカテゴリであり、各タスクのトレーニングデータはそのタスクのトレーニング中にのみ利用できます。ニューラルネットワークは、新しいタスクのトレーニングを受けると、古いタスクを忘れがちです。この特性は、しばしば壊滅的な忘却として知られています。この問題に対処するために、ITLメソッドはエピソード記憶、パラメーターの正則化、マスキングとプルーニング、または拡張可能なネットワーク構造を使用します。本論文では、低階数因数分解に基づく新しいインクリメンタルタスク学習フレームワークを提案する。特に、各層のネットワークの重みを、いくつかのランク1行列の線形結合として表します。新しいタスクのためにネットワークを更新するために、ランク1(または低ランク)の行列を学習し、それをすべてのレイヤーの重みに追加します。また、前のタスクで学習した低ランクの行列に異なる重みを割り当てる追加のセレクターベクトルを紹介します。私たちのアプローチは、精度と忘却の点で現在の最先端の方法よりも優れていることを示しています。私たちの方法はまた、エピソード記憶およびマスクベースのアプローチと比較して、より良い記憶効率を提供します。私たちのコードはhttps://github.com/CSIPlab/task-increment-rank-update.gitで入手できます
Incremental Task learning (ITL) is a category of continual learning that seeks to train a single network for multiple tasks (one after another), where training data for each task is only available during the training of that task. Neural networks tend to forget older tasks when they are trained for the newer tasks; this property is often known as catastrophic forgetting. To address this issue, ITL methods use episodic memory, parameter regularization, masking and pruning, or extensible network structures. In this paper, we propose a new incremental task learning framework based on low-rank factorization. In particular, we represent the network weights for each layer as a linear combination of several rank-1 matrices. To update the network for a new task, we learn a rank-1 (or low-rank) matrix and add that to the weights of every layer. We also introduce an additional selector vector that assigns different weights to the low-rank matrices learned for the previous tasks. We show that our approach performs better than the current state-of-the-art methods in terms of accuracy and forgetting. Our method also offers better memory efficiency compared to episodic memory- and mask-based approaches. Our code will be available at https://github.com/CSIPlab/task-increment-rank-update.git
updated: Tue Jul 19 2022 05:21:14 GMT+0000 (UTC)
published: Tue Jul 19 2022 05:21:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト