近年、さまざまな対照学習ベースの教師なし視覚表現学習方法が設計され、多くの視覚タスクで大きな成功を収めています。一般に、これらの方法は大まかに次の 4 つのカテゴリに分類できます。 (2) BYOL や SimSiam などの正のペアのみを使用する非対照的な方法。 (3) W-MSE や VICReg などのホワイトニング正則化ベースの方法。 (4)CO2などの一貫性のある正則化ベースの方法。この研究では、基本的な親和性行列の新しい観点から、上記の 4 種類の方法すべてに適した新しい統一された対照学習表現フレームワーク (UniCLR という名前) を提示します。さらに、UniCLR に基づいて、SimAffinity、SimWhitening、および SimTrace の 3 つのバリアントが提示されます。さらに、新しい一貫性正則化項として、単純な対称損失がこのフレームワークに基づいて提案されています。アフィニティ行列を対称化することで、トレーニング プロセスの収束を効果的に加速できます。 (1) 提案された UniCLR フレームワークは、最先端技術と同等の優れた結果を達成できること、さらにはそれよりも優れていること、(2) 提案された対称損失がモデルの収束を大幅に加速できること、および ( 3) SimTrace は、非対称設計や停止勾配に依存することなく、白色化された親和性行列のトレースを最大化することで、モード崩壊の問題を回避できます。
In recent years, a variety of contrastive learning based unsupervised visual representation learning methods have been designed and achieved great success in many visual tasks. Generally, these methods can be roughly classified into four categories: (1) standard contrastive methods with an InfoNCE like loss, such as MoCo and SimCLR; (2) non-contrastive methods with only positive pairs, such as BYOL and SimSiam; (3) whitening regularization based methods, such as W-MSE and VICReg; and (4) consistency regularization based methods, such as CO2. In this study, we present a new unified contrastive learning representation framework (named UniCLR) suitable for all the above four kinds of methods from a novel perspective of basic affinity matrix. Moreover, three variants, i.e., SimAffinity, SimWhitening and SimTrace, are presented based on UniCLR. In addition, a simple symmetric loss, as a new consistency regularization term, is proposed based on this framework. By symmetrizing the affinity matrix, we can effectively accelerate the convergence of the training process. Extensive experiments have been conducted to show that (1) the proposed UniCLR framework can achieve superior results on par with and even be better than the state of the art, (2) the proposed symmetric loss can significantly accelerate the convergence of models, and (3) SimTrace can avoid the mode collapse problem by maximizing the trace of a whitened affinity matrix without relying on asymmetry designs or stop-gradients.