arXiv reaDer
事前トレーニング済みモデルのパーソナライズ
Personalizing Pre-trained Models
大規模なデータセットでトレーニングされた自己教師ありモデルまたは弱い教師ありモデルは、少数のショット設定で多様なデータセットへのサンプル効率の高い転送を示しています。アップストリームの事前トレーニング済みモデルをダウンストリームの少数ショット、マルチラベル、および継続的な学習タスクに活用する方法を検討します。私たちのモデル CLIPPER (CLIP PERsonalized) は、弱い自然言語監視を使用してトレーニングされた大規模な画像表現学習モデルである CLIP の画像表現を使用します。マルチラベル、連続、および少数ショットの学習のために、マルチラベル重みインプリンティング (MWI) と呼ばれる手法を開発しました。CLIPPER は、CLIP からの画像表現で MWI を使用します。 10 個の単一ラベル データセットと 5 個のマルチラベル データセットで CLIPPER を評価しました。私たちのモデルは、堅牢で競争力のあるパフォーマンスを示しており、少数ショット、マルチラベル、および継続的な学習の新しいベンチマークを設定しています。私たちの軽量技術は計算効率も高く、データは微調整のためにアップストリーム モデルに送信されないため、プライバシーを保護するアプリケーションが可能になります。
Self-supervised or weakly supervised models trained on large-scale datasets have shown sample-efficient transfer to diverse datasets in few-shot settings. We consider how upstream pretrained models can be leveraged for downstream few-shot, multilabel, and continual learning tasks. Our model CLIPPER (CLIP PERsonalized) uses image representations from CLIP, a large-scale image representation learning model trained using weak natural language supervision. We developed a technique, called Multi-label Weight Imprinting (MWI), for multi-label, continual, and few-shot learning, and CLIPPER uses MWI with image representations from CLIP. We evaluated CLIPPER on 10 single-label and 5 multi-label datasets. Our model shows robust and competitive performance, and we set new benchmarks for few-shot, multi-label, and continual learning. Our lightweight technique is also compute-efficient and enables privacy-preserving applications as the data is not sent to the upstream model for fine-tuning.
updated: Wed Jun 02 2021 22:58:47 GMT+0000 (UTC)
published: Wed Jun 02 2021 22:58:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト