arXiv reaDer
BlackVIP: ロバストな転移学習のためのブラックボックスの視覚的プロンプト
BlackVIP: Black-Box Visual Prompting for Robust Transfer Learning
大規模な事前トレーニング済みモデル (PTM) の急増により、これらのモデルを多数のダウンストリーム タスクに合わせて微調整することが重要な問題になります。その結果、大規模モデルのパラメーター効率的な転移学習 (PETL) が大きな注目を集めています。最近の PETL メソッドは印象的なパフォーマンスを示していますが、楽観的な仮定に依存しています: 1) PTM のパラメーター セット全体が利用可能であり、2) 微調整のための十分に大きなメモリ容量が装備されています。ただし、ほとんどの実際のアプリケーションでは、PTM はブラックボックス API または明示的なパラメーター アクセスのない独自のソフトウェアとして提供されます。その上、最新の PTM の大きなメモリ要件を満たすのは困難です。この作業では、モデル アーキテクチャとパラメーターに関する知識がなくても PTM を効率的に適応させるブラック ボックス ビジュアル プロンプト (BlackVIP) を提案します。 BlackVIP には 2 つのコンポーネントがあります。 1) コーディネーターおよび 2) 勾配補正による同時摂動確率近似 (SPSA-GC)。コーディネーターは、入力に依存する画像の形をした視覚的なプロンプトを設計します。これにより、少数ショットの適応と、分布/場所のシフトに対する堅牢性が向上します。 SPSA-GC は、ターゲット モデルの勾配を効率的に推定して Coordinator を更新します。 16 のデータセットでの広範な実験により、BlackVIP は、最小限のメモリ要件で、PTM のパラメーターにアクセスすることなく、多様なドメインへの堅牢な適応を可能にすることが実証されています。コード: https://github.com/changdaeoh/BlackVIP
With the surge of large-scale pre-trained models (PTMs), fine-tuning these models to numerous downstream tasks becomes a crucial problem. Consequently, parameter efficient transfer learning (PETL) of large models has grasped huge attention. While recent PETL methods showcase impressive performance, they rely on optimistic assumptions: 1) the entire parameter set of a PTM is available, and 2) a sufficiently large memory capacity for the fine-tuning is equipped. However, in most real-world applications, PTMs are served as a black-box API or proprietary software without explicit parameter accessibility. Besides, it is hard to meet a large memory requirement for modern PTMs. In this work, we propose black-box visual prompting (BlackVIP), which efficiently adapts the PTMs without knowledge about model architectures and parameters. BlackVIP has two components; 1) Coordinator and 2) simultaneous perturbation stochastic approximation with gradient correction (SPSA-GC). The Coordinator designs input-dependent image-shaped visual prompts, which improves few-shot adaptation and robustness on distribution/location shift. SPSA-GC efficiently estimates the gradient of a target model to update Coordinator. Extensive experiments on 16 datasets demonstrate that BlackVIP enables robust adaptation to diverse domains without accessing PTMs' parameters, with minimal memory requirements. Code: https://github.com/changdaeoh/BlackVIP
updated: Sun Mar 26 2023 16:42:05 GMT+0000 (UTC)
published: Sun Mar 26 2023 16:42:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト