arXiv reaDer
POP: 継続的な学習のためのプロンプトのプロンプト
POP: Prompt Of Prompts for Continual Learning
継続学習(CL)は、最近ますます注目を集めています。これは、致命的な忘れを起こすことなく新しい概念を学習する人間の能力を模倣することを目的としています。既存の CL 手法はこれをある程度実現しますが、学習された特徴空間の意味論的なドリフトが依然として発生する傾向があります。基盤モデルは、非常に大規模なデータセットから学習された堅牢な特徴表現を備えており、CL 問題の解決に興味深い基盤を提供します。最近の研究では、表現の一般性をほとんど損なうことなく、迅速な調整技術によって特定のタスクに適応できることも示しています。ただし、未解決の問題は、タスク固有のプロンプトとグローバルなプロンプトの両方を学習する方法、つまりタスク間の情報を取得する方法です。この研究では、Prompt Of Prompts (POP) モデルを提案します。このモデルは、タスク指定のプロンプトのグループと、POP として示されるグローバル プロンプトのグループを段階的に学習し、前者からの情報を統合することでこの目標に取り組みます。 POP 学習を備えた基礎モデルが、古典的な CL 手法を大幅に上回るパフォーマンスを発揮できることを示します。さらに、プロンプト チューニングには少数のトレーニング サンプルのみが必要なため、POP は少数ショット設定で CL を実行できると同時に、データセット全体でトレーニングされた競合手法よりも優れたパフォーマンスを発揮します。
Continual learning (CL) has attracted increasing attention in the recent past. It aims to mimic the human ability to learn new concepts without catastrophic forgetting. While existing CL methods accomplish this to some extent, they are still prone to semantic drift of the learned feature space. Foundation models, which are endowed with a robust feature representation, learned from very large datasets, provide an interesting substrate for the solution of the CL problem. Recent work has also shown that they can be adapted to specific tasks by prompt tuning techniques that leave the generality of the representation mostly unscathed. An open question is, however, how to learn both prompts that are task specific and prompts that are global, i.e. capture cross-task information. In this work, we propose the Prompt Of Prompts (POP) model, which addresses this goal by progressively learning a group of task-specified prompts and a group of global prompts, denoted as POP, to integrate information from the former. We show that a foundation model equipped with POP learning is able to outperform classic CL methods by a significant margin. Moreover, as prompt tuning only requires a small set of training samples, POP is able to perform CL in the few-shot setting, while still outperforming competing methods trained on the entire dataset.
updated: Wed Jun 14 2023 02:09:26 GMT+0000 (UTC)
published: Wed Jun 14 2023 02:09:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト