Pseudo-Rehearsal for Continual Learning with Normalizing Flows
壊滅的な忘却(CF)は、ニューラルネットワークが新しいタスクのトレーニング中に過去の知識を上書きするたびに発生します。 CFを処理する一般的な手法には、重みの正則化(過去のタスクでの重要性などを使用)、およびネットワークが常に過去のデータに再トレーニングされるリハーサル戦略が含まれます。生成モデルは、無限のデータソースを持つために後者にも適用されています。この論文では、正則化の強みと生成ベースのリハーサルアプローチを組み合わせる新しい方法を提案します。私たちの生成モデルは、ネットワークの内部埋め込みでトレーニングされた、確率的で可逆的なニューラルネットワークである正規化フロー(NF)で構成されています。タスクで条件付けされた単一のNFを維持することにより、メモリオーバーヘッドが一定のままであることを示します。さらに、NFの可逆性を利用して、過去のタスクに関してネットワークの埋め込みを正規化する簡単なアプローチを提案します。私たちの方法は、限られた計算能力とメモリのオーバーヘッドで、文献の最先端のアプローチに関して有利に機能することを示しています。
Catastrophic forgetting (CF) happens whenever a neural network overwrites past knowledge while being trained on new tasks. Common techniques to handle CF include regularization of the weights (using, e.g., their importance on past tasks), and rehearsal strategies, where the network is constantly re-trained on past data. Generative models have also been applied for the latter, in order to have endless sources of data. In this paper, we propose a novel method that combines the strengths of regularization and generative-based rehearsal approaches. Our generative model consists of a normalizing flow (NF), a probabilistic and invertible neural network, trained on the internal embeddings of the network. By keeping a single NF conditioned on the task, we show that our memory overhead remains constant. In addition, exploiting the invertibility of the NF, we propose a simple approach to regularize the network's embeddings with respect to past tasks. We show that our method performs favorably with respect to state-of-the-art approaches in the literature, with bounded computational power and memory overheads.
updated: Thu Aug 05 2021 15:32:02 GMT+0000 (UTC)
published: Sun Jul 05 2020 20:43:52 GMT+0000 (UTC)
