Weakly Supervised Contrastive Learning
教師なし視覚表現学習は、対照学習の最近の成果により、コンピュータービジョンコミュニティから多くの注目を集めています。既存の対照学習フレームワークのほとんどは、インスタンスの識別を口実タスクとして採用しており、すべてのインスタンスを異なるクラスとして扱います。ただし、そのようなメソッドは必然的にクラスの衝突の問題を引き起こし、学習された表現の品質を損ないます。この観察に動機付けられて、この問題に取り組むために、弱教師あり対照学習フレームワーク(WCL)を導入しました。具体的には、提案されたフレームワークは2つのプロジェクションヘッドに基づいており、そのうちの1つは通常のインスタンス識別タスクを実行します。もう一方のヘッドは、グラフベースの方法を使用して類似のサンプルを探索し、弱いラベルを生成してから、弱いラベルに基づいて教師あり対照学習タスクを実行して、類似の画像を近づけます。さらに、陽性サンプルの数を増やすために、K最近傍法に基づくマルチクロップ戦略を導入しました。広範な実験結果は、WCLがさまざまなデータセット間で自己監視表現の品質を向上させることを示しています。特に、半教師あり学習の新しい最先端の結果が得られます。ラベル付けされた例が1%と10%しかないため、WCLはResNet50を使用して65%と72%のImageNet Top-1精度を達成します。これは、ResNet101を使用したSimCLRv2よりもさらに高くなります。
Unsupervised visual representation learning has gained much attention from the computer vision community because of the recent achievement of contrastive learning. Most of the existing contrastive learning frameworks adopt the instance discrimination as the pretext task, which treating every single instance as a different class. However, such method will inevitably cause class collision problems, which hurts the quality of the learned representation. Motivated by this observation, we introduced a weakly supervised contrastive learning framework (WCL) to tackle this issue. Specifically, our proposed framework is based on two projection heads, one of which will perform the regular instance discrimination task. The other head will use a graph-based method to explore similar samples and generate a weak label, then perform a supervised contrastive learning task based on the weak label to pull the similar images closer. We further introduced a K-Nearest Neighbor based multi-crop strategy to expand the number of positive samples. Extensive experimental results demonstrate WCL improves the quality of self-supervised representations across different datasets. Notably, we get a new state-of-the-art result for semi-supervised learning. With only 1% and 10% labeled examples, WCL achieves 65% and 72% ImageNet Top-1 Accuracy using ResNet50, which is even higher than SimCLRv2 with ResNet101.
updated: Sun Oct 10 2021 12:03:52 GMT+0000 (UTC)
published: Sun Oct 10 2021 12:03:52 GMT+0000 (UTC)
