教師なし特徴学習は、キュレートされたクラスバランスの取れたデータセットでベンチマークされたように、インスタンスの識別と不変のマッピングに基づく対照的な学習で大きな進歩を遂げました。ただし、自然データは高度に相関し、ロングテールで分散する可能性があります。インスタンス間の自然な類似性は、推定されるインスタンスの区別と競合し、不安定なトレーニングとパフォーマンスの低下を引き起こします。私たちのアイデアは、インスタンスのグループ化によって直接ではなく、インスタンスとローカルインスタンスグループ間のクロスレベル識別(CLD)によって、インスタンス間の類似性を発見し、対照的な学習に統合することです。各インスタンスの不変のマッピングは、その拡張されたビュー内の引力によって課されますが、インスタンス間の類似性は、インスタンスグループに対する一般的な反発から生じる可能性があります。バッチごとの比較とクロスビューの比較も、対照学習の正/負のサンプル比を大幅に改善し、より優れた不変マッピングを実現します。グループ化と識別の両方の目的を達成するために、共有表現から個別に派生した機能にそれらを課します。さらに、正規化された投影ヘッドと教師なしハイパーパラメータ調整を初めて提案します。私たちの広範な実験は、CLDが、相関性の高い、ロングテール、またはバランスの取れたデータセットでのNPID、MoCo、InfoMin、BYOLなどの既存のメソッドへの無駄のない強力なアドオンであることを示しています。自己監視、半教師あり、および転移学習のベンチマークで最新の技術を実現するだけでなく、はるかに大規模なコンピューティングで達成されたすべての報告されたパフォーマンスでMoCov2およびSimCLRを上回ります。 CLDは、教師なし学習を自然なデータや実際のアプリケーションに効果的に近づけます。私たちのコードはhttps://github.com/frank-xwang/CLD-UnsupervisedLearningで公開されています。
Unsupervised feature learning has made great strides with contrastive learning based on instance discrimination and invariant mapping, as benchmarked on curated class-balanced datasets. However, natural data could be highly correlated and long-tail distributed. Natural between-instance similarity conflicts with the presumed instance distinction, causing unstable training and poor performance. Our idea is to discover and integrate between-instance similarity into contrastive learning, not directly by instance grouping, but by cross-level discrimination (CLD) between instances and local instance groups. While invariant mapping of each instance is imposed by attraction within its augmented views, between-instance similarity could emerge from common repulsion against instance groups. Our batch-wise and cross-view comparisons also greatly improve the positive/negative sample ratio of contrastive learning and achieve better invariant mapping. To effect both grouping and discrimination objectives, we impose them on features separately derived from a shared representation. In addition, we propose normalized projection heads and unsupervised hyper-parameter tuning for the first time. Our extensive experimentation demonstrates that CLD is a lean and powerful add-on to existing methods such as NPID, MoCo, InfoMin, and BYOL on highly correlated, long-tail, or balanced datasets. It not only achieves new state-of-the-art on self-supervision, semi-supervision, and transfer learning benchmarks, but also beats MoCo v2 and SimCLR on every reported performance attained with a much larger compute. CLD effectively brings unsupervised learning closer to natural data and real-world applications. Our code is publicly available at: https://github.com/frank-xwang/CLD-UnsupervisedLearning.