Contrastive Conditional Transport for Representation Learning
対照学習(CL)は、ラベルの監視なしでデータ表現を学習することで目覚ましい成功を収めました。ただし、従来のCL損失は、含まれるネガティブサンプルの数とそれらの選択方法に敏感です。このホワイトペーパーでは、依存するサンプルとクエリのペアに対するCL損失を定義する、対照的な条件付きトランスポート(CCT)を提案します。これは、実際には、ランダムクエリを描画し、正と負のサンプルをランダムに選択し、これらのサンプルをクエリ。より遠い正のサンプルをクエリに向かって引き寄せ、より近い負のサンプルをクエリから遠ざけるために、より大きな力を発揮します。理論的分析は、この独自の対照的な再重み付けスキームが、表現空間でポジティブサンプルをクエリに合わせ、ネガティブサンプルとクエリ間の相互情報量を減らすのに役立つことを示しています。標準的な視覚タスクに関する大規模な大規模な実験は、CCTが対照表現学習においてベンチマークデータセットの既存の方法を一貫して上回っているだけでなく、解釈可能な対照的な重みと潜在的な表現も提供することを示しています。 PyTorchコードが提供されます。
Contrastive learning (CL) has achieved remarkable success in learning data representations without label supervision. However, the conventional CL loss is sensitive to how many negative samples are included and how they are selected. This paper proposes contrastive conditional transport (CCT) that defines its CL loss over dependent sample-query pairs, which in practice is realized by drawing a random query, randomly selecting positive and negative samples, and contrastively reweighting these samples according to their distances to the query, exerting a greater force to both pull more distant positive samples towards the query and push closer negative samples away from the query. Theoretical analysis shows that this unique contrastive reweighting scheme helps in the representation space to both align the positive samples with the query and reduce the mutual information between the negative sample and query. Extensive large-scale experiments on standard vision tasks show that CCT not only consistently outperforms existing methods on benchmark datasets in contrastive representation learning but also provides interpretable contrastive weights and latent representations. PyTorch code will be provided.
updated: Sat May 08 2021 17:25:08 GMT+0000 (UTC)
published: Sat May 08 2021 17:25:08 GMT+0000 (UTC)
