実世界のデータは通常、ロングテール分布に従います。ここでは、少数の多数派のカテゴリがほとんどのデータを占め、ほとんどの少数派のカテゴリには限られた数のサンプルが含まれています。テールクラスを表現および分類するためのクロスエントロピーの苦労を最小限に抑える分類モデル。偏りのない分類器を学習する問題は十分に研究されていますが、不均衡なデータを表現する方法は十分に検討されていません。この論文では、不均衡なデータの表現学習に焦点を当てます。最近、監視された対照的な学習は、最近、バランスの取れたデータで有望なパフォーマンスを示しています。ただし、理論的な分析により、ロングテールデータの場合、表現学習に理想的な幾何学的構成である通常のシンプレックスを形成できないことがわかりました。 SCLの最適化動作を修正し、ロングテール視覚認識のパフォーマンスをさらに向上させるために、バランスの取れた対照学習(BCL)の新しい損失を提案します。 SCLと比較すると、BCLには2つの改善点があります。クラス平均化。これは、負のクラスの勾配の寄与のバランスを取ります。 class-complement。これにより、すべてのクラスをすべてのミニバッチに表示できます。提案されたバランスのとれた対比学習(BCL)法は、通常のシンプレックスを形成する条件を満たすものであり、クロスエントロピーの最適化を支援します。 BCLを搭載した、提案された2ブランチフレームワークは、より強力な機能表現を取得し、CIFAR-10-LT、CIFAR-100-LT、ImageNet-LT、iNaturalist2018などのロングテールベンチマークデータセットで競争力のあるパフォーマンスを実現できます。私たちのコードはhttps://github.com/FlamieZhu/BCLthisURLで入手できます。
Real-world data typically follow a long-tailed distribution, where a few majority categories occupy most of the data while most minority categories contain a limited number of samples. Classification models minimizing cross-entropy struggle to represent and classify the tail classes. Although the problem of learning unbiased classifiers has been well studied, methods for representing imbalanced data are under-explored. In this paper, we focus on representation learning for imbalanced data. Recently, supervised contrastive learning has shown promising performance on balanced data recently. However, through our theoretical analysis, we find that for long-tailed data, it fails to form a regular simplex which is an ideal geometric configuration for representation learning. To correct the optimization behavior of SCL and further improve the performance of long-tailed visual recognition, we propose a novel loss for balanced contrastive learning (BCL). Compared with SCL, we have two improvements in BCL: class-averaging, which balances the gradient contribution of negative classes; class-complement, which allows all classes to appear in every mini-batch. The proposed balanced contrastive learning (BCL) method satisfies the condition of forming a regular simplex and assists the optimization of cross-entropy. Equipped with BCL, the proposed two-branch framework can obtain a stronger feature representation and achieve competitive performance on long-tailed benchmark datasets such as CIFAR-10-LT, CIFAR-100-LT, ImageNet-LT, and iNaturalist2018. Our code is available at https://github.com/FlamieZhu/BCLthis URL.