arXiv reaDer
ユニファイド ビジョンと言語プロンプト ラーニング
Unified Vision and Language Prompt Learning
CLIP のような大規模なビジョン言語モデルが登場して以来、プロンプト チューニング (モデルの入力空間内の少数のパラメーターのみを調整する、パラメーターおよびデータ効率の高い転送学習パラダイム) は、ビジョン コミュニティのトレンドになっています。テキスト プロンプト チューニングとビジュアル プロンプト チューニングという 2 つの代表的なプロンプト チューニング方法に関する体系的な研究を紹介します。主な調査結果は、ユニモーダル プロンプト チューニング方法のいずれも一貫してうまく機能しないことです。テキスト プロンプト チューニングは、クラス内の視覚的分散が高いデータでは失敗しますが、ビジュアル プロンプト チューニングは、クラス間分散が小さいデータを処理できません。両方の長所を組み合わせるために、Unified Prompt Tuning (UPT) と呼ばれるシンプルなアプローチを提案します。これは、基本的に小さなニューラル ネットワークを学習して、異なるモダリティ間でプロンプトを共同で最適化します。 11 を超えるビジョン データセットに関する広範な実験により、UPT は、少数ショット学習ベンチマークおよびドメイン一般化ベンチマークで、ユニモーダル カウンターパートよりも優れたトレードオフを達成することが示されています。将来の研究を容易にするために、コードとモデルがリリースされます。
Prompt tuning, a parameter- and data-efficient transfer learning paradigm that tunes only a small number of parameters in a model's input space, has become a trend in the vision community since the emergence of large vision-language models like CLIP. We present a systematic study on two representative prompt tuning methods, namely text prompt tuning and visual prompt tuning. A major finding is that none of the unimodal prompt tuning methods performs consistently well: text prompt tuning fails on data with high intra-class visual variances while visual prompt tuning cannot handle low inter-class variances. To combine the best from both worlds, we propose a simple approach called Unified Prompt Tuning (UPT), which essentially learns a tiny neural network to jointly optimize prompts across different modalities. Extensive experiments on over 11 vision datasets show that UPT achieves a better trade-off than the unimodal counterparts on few-shot learning benchmarks, as well as on domain generalization benchmarks. Code and models will be released to facilitate future research.
updated: Thu Oct 13 2022 17:50:24 GMT+0000 (UTC)
published: Thu Oct 13 2022 17:50:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト