arXiv reaDer
一般化された教師あり対照学習
Generalized Supervised Contrastive Learning
自己教師あり学習パラダイムにおける対比学習の最近の有望な結果により、教師あり対比学習は、これらの対比アプローチを教師ありコンテキストに拡張することに成功し、さまざまなデータセットでクロスエントロピーを上回るパフォーマンスを発揮しました。ただし、教師あり対比学習は本質的に、ワンホット ターゲット ベクトルを使用して、バイナリ形式 (正または負) のラベル情報を使用します。この構造は、CutMix や知識の蒸留など、ラベル情報を確率分布として利用する方法に適応するのに苦労します。この論文では、ラベルの類似性と潜在的な類似性の間のクロスエントロピーを測定する一般化された教師付きコントラスト損失を導入します。この概念は、ラベル分布を完全に利用し、最新のニューラル ネットワークをトレーニングするためのさまざまな既存の手法の適応を可能にすることにより、教師付きコントラスト損失の機能を強化します。この一般化された教師付きコントラスト損失を活用して、カスタマイズされたフレームワークである一般化教師付きコントラスト学習 (GenSCL) を構築します。既存の対照的な学習フレームワークと比較して、GenSCL には、高度な画像ベースの正則化技術や任意の教師分類器などの追加機能が組み込まれています。 Momentum Contrast 技術を使用して ResNet50 に適用すると、GenSCL は ImageNet 上で 77.3% というトップ 1 の精度を達成します。これは、従来の教師ありコントラスト学習と比較して 4.1% の相対的な向上です。さらに、私たちの手法は、ResNet50 に適用した場合、CIFAR10 と CIFAR100 でそれぞれ 98.2% と 87.0% という新しい最先端の精度を確立し、このアーキテクチャで報告されている最高の数値をマークしています。
With the recent promising results of contrastive learning in the self-supervised learning paradigm, supervised contrastive learning has successfully extended these contrastive approaches to supervised contexts, outperforming cross-entropy on various datasets. However, supervised contrastive learning inherently employs label information in a binary form--either positive or negative--using a one-hot target vector. This structure struggles to adapt to methods that exploit label information as a probability distribution, such as CutMix and knowledge distillation. In this paper, we introduce a generalized supervised contrastive loss, which measures cross-entropy between label similarity and latent similarity. This concept enhances the capabilities of supervised contrastive loss by fully utilizing the label distribution and enabling the adaptation of various existing techniques for training modern neural networks. Leveraging this generalized supervised contrastive loss, we construct a tailored framework: the Generalized Supervised Contrastive Learning (GenSCL). Compared to existing contrastive learning frameworks, GenSCL incorporates additional enhancements, including advanced image-based regularization techniques and an arbitrary teacher classifier. When applied to ResNet50 with the Momentum Contrast technique, GenSCL achieves a top-1 accuracy of 77.3% on ImageNet, a 4.1% relative improvement over traditional supervised contrastive learning. Moreover, our method establishes new state-of-the-art accuracies of 98.2% and 87.0% on CIFAR10 and CIFAR100 respectively when applied to ResNet50, marking the highest reported figures for this architecture.
updated: Sun May 21 2023 16:50:33 GMT+0000 (UTC)
published: Wed Jun 01 2022 10:38:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト