arXiv reaDer
統一された条件付きモデルを備えた自己訓練ビジョン言語BERT
Self-Training Vision Language BERTs with a Unified Conditional Model
自然言語BERTは、自己監視方式で言語コーパスを使用してトレーニングされます。自然言語のBERTとは異なり、視覚言語のBERTは、トレーニングするためにペアのデータを必要とします。これにより、VL-BERTの事前トレーニングの規模が制限されます。ラベルのない画像データからVL-BERTをトレーニングできるセルフトレーニングアプローチを提案します。提案された方法は、統一された条件付きモデル、つまりゼロショット条件付き生成を実行できるビジョン言語BERTモデルから始まります。さまざまな条件が与えられると、統合された条件付きモデルは、キャプション、密なキャプション、さらには質問を生成できます。ラベル付き画像データを使用して教師モデルをトレーニングし、トレーニング済みモデルを使用してラベルなし画像データに疑似キャプションを生成します。次に、ラベル付きデータと疑似ラベル付きデータを組み合わせて、学生モデルをトレーニングします。このプロセスは、生徒モデルを新しい教師として配置することによって繰り返されます。提案されたセルフトレーニングアプローチとわずか300kのラベルなしの追加データを使用することで、300万の追加画像データでトレーニングされた同様のモデルサイズのモデルと比較して、競争力のある、またはさらに優れたパフォーマンスを得ることができます。
Natural language BERTs are trained with language corpus in a self-supervised manner. Unlike natural language BERTs, vision language BERTs need paired data to train, which restricts the scale of VL-BERT pretraining. We propose a self-training approach that allows training VL-BERTs from unlabeled image data. The proposed method starts with our unified conditional model -- a vision language BERT model that can perform zero-shot conditional generation. Given different conditions, the unified conditional model can generate captions, dense captions, and even questions. We use the labeled image data to train a teacher model and use the trained model to generate pseudo captions on unlabeled image data. We then combine the labeled data and pseudo labeled data to train a student model. The process is iterated by putting the student model as a new teacher. By using the proposed self-training approach and only 300k unlabeled extra data, we are able to get competitive or even better performances compared to the models of similar model size trained with 3 million extra image data.
updated: Thu Jan 19 2023 08:10:09 GMT+0000 (UTC)
published: Thu Jan 06 2022 11:00:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト