arXiv reaDer
三項機能マスク:タスク増分学習の忘却ゼロ
Ternary Feature Masks: zero-forgetting for task-incremental learning
推論でタスクラベルがわかっているタスク認識体制の継続的な学習を忘れることなくアプローチを提案します。三元マスクを使用することで、モデルを新しいタスクにアップグレードし、以前のタスクの知識を再利用しながら、それらについて何も忘れることはありません。マスクを使用すると、壊滅的な忘却と後方転送の両方を防ぐことができます。前者を回避することで、実際にはめったに観察されない後者の欠如を大部分補うと主張し、実験的に示します。以前の作品とは対照的に、私たちのマスクは、重みの代わりに各レイヤーの機能(アクティブ化)に適用されます。これにより、新しいタスクごとにマスクパラメータの数が大幅に削減されます。ほとんどのネットワークで3桁以上あります。三元マスクを機能ごとに2ビットにエンコードすると、ネットワークへのオーバーヘッドがほとんど発生せず、スケーラビリティの問題が回避されます。以前のタスクでこれらの機能の動作を変更せずに、すでに学習した機能を現在のタスクに適応させるために、タスク固有の機能の正規化を導入します。いくつかのきめ細かいデータセットとImageNetでの広範な実験は、重みベースのアプローチと比較して、メモリオーバーヘッドを削減しながら、私たちの方法が現在の最先端を上回っていることを示しています。
We propose an approach without any forgetting to continual learning for the task-aware regime, where at inference the task-label is known. By using ternary masks we can upgrade a model to new tasks, reusing knowledge from previous tasks while not forgetting anything about them. Using masks prevents both catastrophic forgetting and backward transfer. We argue -- and show experimentally -- that avoiding the former largely compensates for the lack of the latter, which is rarely observed in practice. In contrast to earlier works, our masks are applied to the features (activations) of each layer instead of the weights. This considerably reduces the number of mask parameters for each new task; with more than three orders of magnitude for most networks. The encoding of the ternary masks into two bits per feature creates very little overhead to the network, avoiding scalability issues. To allow already learned features to adapt to the current task without changing the behavior of these features for previous tasks, we introduce task-specific feature normalization. Extensive experiments on several finegrained datasets and ImageNet show that our method outperforms current state-of-the-art while reducing memory overhead in comparison to weight-based approaches.
updated: Wed Apr 21 2021 10:34:21 GMT+0000 (UTC)
published: Thu Jan 23 2020 18:08:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト