arXiv reaDer
継続的な学習を促すための学習
Learning to Prompt for Continual Learning
継続的な学習の背後にある主流のパラダイムは、モデルパラメータを非定常データ分布に適応させることでした。そこでは、壊滅的な忘却が中心的な課題です。典型的な方法は、テスト時にリハーサルバッファまたは既知のタスクIDに依存して、学習した知識を取得し、忘却に対処します。この作業は、テスト時にタスクIDにアクセスせずに、より簡潔なメモリシステムをトレーニングすることを目的とした継続的な学習の新しいパラダイムを示します。私たちの方法は、事前にトレーニングされたモデルを動的にプロンプト(L2P)して、さまざまなタスク遷移の下でタスクを順番に学習することを学習します。提案されたフレームワークでは、プロンプトは学習可能な小さなパラメータであり、メモリ空間に保持されます。目的は、プロンプトを最適化してモデルの予測を指示し、モデルの可塑性を維持しながら、タスク不変およびタスク固有の知識を明示的に管理することです。 L2Pが以前の最先端の方法を一貫して上回っている、さまざまな挑戦的な継続的な学習設定を使用して、人気のある画像分類ベンチマークの下で包括的な実験を実施します。驚くべきことに、L2Pは、リハーサルバッファーがなくても、リハーサルベースの方法に対して競争力のある結果を達成し、課題にとらわれない継続的な学習に直接適用できます。ソースコードはhttps://github.com/google-research/l2pで入手できます。
The mainstream paradigm behind continual learning has been to adapt the model parameters to non-stationary data distributions, where catastrophic forgetting is the central challenge. Typical methods rely on a rehearsal buffer or known task identity at test time to retrieve learned knowledge and address forgetting, while this work presents a new paradigm for continual learning that aims to train a more succinct memory system without accessing task identity at test time. Our method learns to dynamically prompt (L2P) a pre-trained model to learn tasks sequentially under different task transitions. In our proposed framework, prompts are small learnable parameters, which are maintained in a memory space. The objective is to optimize prompts to instruct the model prediction and explicitly manage task-invariant and task-specific knowledge while maintaining model plasticity. We conduct comprehensive experiments under popular image classification benchmarks with different challenging continual learning settings, where L2P consistently outperforms prior state-of-the-art methods. Surprisingly, L2P achieves competitive results against rehearsal-based methods even without a rehearsal buffer and is directly applicable to challenging task-agnostic continual learning. Source code is available at https://github.com/google-research/l2p.
updated: Mon Mar 21 2022 19:26:32 GMT+0000 (UTC)
published: Thu Dec 16 2021 06:17:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト