arXiv reaDer
メタ学習による継続的な学習のための再利用可能な知識の最適化
Optimizing Reusable Knowledge for Continual Learning via Metalearning
時間の経過とともにタスクを学習する場合、人工ニューラルネットワークはCatastrophic Forgetting(CF)として知られる問題に悩まされます。これは、新しいタスクのトレーニング中にネットワークの重みが上書きされ、古い情報が忘れられた場合に発生します。この問題に対処するために、新しいタスクを学習するときに上書きするのではなく、重みの再利用性を促進する新しい方法である MetA Reusable Knowledge (MARK) を提案します。具体的には、MARKはタスク間で共有される重みのセットを保持します。これらの共有された重みは、新しいタスクを学習するために使用されるだけでなく、モデルが新しいタスクを学習するときに新しい知識で強化される共通の知識ベース(KB)として想定されています。 MARK の背後にある主要なコンポーネントは 2 つあります。一方では、メタ学習アプローチは、KBを新しい知識で段階的に充実させ、タスク間の重みの再利用性を促進するための重要なメカニズムを提供します。一方、トレーニング可能なマスクのセットは、KBに関連する重みから選択的に選択して、各タスクを解決するための主要なメカニズムを提供します。 MARKを使用することで、いくつかの人気のあるベンチマークで最先端の結果を達成し、20-Split-MiniImageNetデータセットで平均精度の点で最高のパフォーマンスの方法を10%以上上回り、数の55%を使用して忘却をほぼゼロにしています。パラメータの。さらに、アブレーション研究は、実際、MARKが各タスクで選択的に使用される再利用可能な知識を学習しているという証拠を提供します。
When learning tasks over time, artificial neural networks suffer from a problem known as Catastrophic Forgetting (CF). This happens when the weights of a network are overwritten during the training of a new task causing forgetting of old information. To address this issue, we propose MetA Reusable Knowledge or MARK, a new method that fosters weight reusability instead of overwriting when learning a new task. Specifically, MARK keeps a set of shared weights among tasks. We envision these shared weights as a common Knowledge Base (KB) that is not only used to learn new tasks, but also enriched with new knowledge as the model learns new tasks. Key components behind MARK are two-fold. On the one hand, a metalearning approach provides the key mechanism to incrementally enrich the KB with new knowledge and to foster weight reusability among tasks. On the other hand, a set of trainable masks provides the key mechanism to selectively choose from the KB relevant weights to solve each task. By using MARK, we achieve state of the art results in several popular benchmarks, surpassing the best performing methods in terms of average accuracy by over 10% on the 20-Split-MiniImageNet dataset, while achieving almost zero forgetfulness using 55% of the number of parameters. Furthermore, an ablation study provides evidence that, indeed, MARK is learning reusable knowledge that is selectively used by each task.
updated: Tue Nov 30 2021 20:44:26 GMT+0000 (UTC)
published: Wed Jun 09 2021 21:09:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト