arXiv reaDer
AdCo:自己訓練された負の敵からの教師なし表現の効率的な学習のための敵対的対比
AdCo: Adversarial Contrast for Efficient Learning of Unsupervised Representations from Self-Trained Negative Adversaries
対照的な学習は、表現が自己訓練されている場合、肯定的なクエリを区別するのが十分に難しい否定的な例のコレクションを構築することに依存しています。既存の対照学習法は、ミニバッチ上でネガティブサンプルのキューを維持し、その一部のみが反復で更新されるか、現在のミニバッチの他の例のみをネガティブとして使用します。キュー全体を更新することによって、反復を通じて学習された表現の変化を綿密に追跡したり、過去のミニバッチから有用な情報を破棄したりすることはできませんでした。あるいは、自己訓練された表現と対戦する一連の否定的な敵を直接学ぶために提示します。表現ネットワークと否定的な敵の2人のプレーヤーが交互に更新され、肯定的なクエリの表現が識別できるようにトレーニングされる最も困難な否定的な例が取得されます。さらに、ネガティブな敵対者は、敵対的な対照的損失を最大化することにより、ポジティブなクエリの加重組み合わせに向けて更新され、それによって、時間の経過に伴う表現の変化を綿密に追跡できることを示します。実験結果は、提案されたAdversarial Contrastive(AdCo)モデルが優れたパフォーマンス(200エポックで73.2%、800エポックで75.7%のトップ1精度、ImageNetでの線形評価)を達成するだけでなく、より効率的に事前トレーニングできることを示しています。より少ないエポックで。
Contrastive learning relies on constructing a collection of negative examples that are sufficiently hard to discriminate against positive queries when their representations are self-trained. Existing contrastive learning methods either maintain a queue of negative samples over minibatches while only a small portion of them are updated in an iteration, or only use the other examples from the current minibatch as negatives. They could not closely track the change of the learned representation over iterations by updating the entire queue as a whole, or discard the useful information from the past minibatches. Alternatively, we present to directly learn a set of negative adversaries playing against the self-trained representation. Two players, the representation network and negative adversaries, are alternately updated to obtain the most challenging negative examples against which the representation of positive queries will be trained to discriminate. We further show that the negative adversaries are updated towards a weighted combination of positive queries by maximizing the adversarial contrastive loss, thereby allowing them to closely track the change of representations over time. Experiment results demonstrate the proposed Adversarial Contrastive (AdCo) model not only achieves superior performances (a top-1 accuracy of 73.2% over 200 epochs and 75.7% over 800 epochs with linear evaluation on ImageNet), but also can be pre-trained more efficiently with fewer epochs.
updated: Mon Jan 04 2021 03:01:28 GMT+0000 (UTC)
published: Tue Nov 17 2020 05:45:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト