arXiv reaDer
継続的な学習、速くても遅くても
Continual Learning, Fast and Slow
神経科学における相補学習システム (CLS) 理論 (mcclellland1995) によれば、人間は 2 つの相補的なシステムを通じて効果的な継続学習を行っています。そして、環境に関する構造化された知識を徐々に獲得するために、新皮質に位置する遅い学習システム。この理論に動機づけられて、我々は、特定のタスクからのパターン分離表現の教師あり学習のための高速学習システムと、タスクに依存しない一般表現の表現学習のための低速学習システムで構成される一般的な継続学習フレームワークである DualNets (デュアルネットワーク用) を提案します。自己教師あり学習 (SSL)。 DualNets は、両方の表現タイプを包括的なフレームワークにシームレスに組み込むことができ、ディープ ニューラル ネットワークでの継続的な学習を促進します。広範な実験を通じて、標準的なオフラインのタスク認識設定から、困難なオンラインのタスクのないシナリオに至るまで、幅広い継続学習プロトコルにおける DualNets の有望な結果を実証しました。特に、ビジュアルイメージが大きく異なる関連性のないタスクを含む CTrL~veniat2020efficient ベンチマークでは、DualNets は既存の最先端の動的アーキテクチャ戦略 ~ostapenko2021continual を使用して競争力のあるパフォーマンスを達成できます。さらに、DualNets の有効性、堅牢性、拡張性を検証するために、包括的なアブレーション研究を実施しています。コードは https://github.com/phquang/DualNet で利用可能になります。
According to the Complementary Learning Systems (CLS) theory~mcclelland1995there in neuroscience, humans do effective continual learning through two complementary systems: a fast learning system centered on the hippocampus for rapid learning of the specifics, individual experiences; and a slow learning system located in the neocortex for the gradual acquisition of structured knowledge about the environment. Motivated by this theory, we propose DualNets (for Dual Networks), a general continual learning framework comprising a fast learning system for supervised learning of pattern-separated representation from specific tasks and a slow learning system for representation learning of task-agnostic general representation via Self-Supervised Learning (SSL). DualNets can seamlessly incorporate both representation types into a holistic framework to facilitate better continual learning in deep neural networks. Via extensive experiments, we demonstrate the promising results of DualNets on a wide range of continual learning protocols, ranging from the standard offline, task-aware setting to the challenging online, task-free scenario. Notably, on the CTrL~veniat2020efficient benchmark that has unrelated tasks with vastly different visual images, DualNets can achieve competitive performance with existing state-of-the-art dynamic architecture strategies~ostapenko2021continual. Furthermore, we conduct comprehensive ablation studies to validate DualNets efficacy, robustness, and scalability. Code will be made available at https://github.com/phquang/DualNet.
updated: Sun Jul 09 2023 10:02:41 GMT+0000 (UTC)
published: Tue Sep 06 2022 10:48:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト