arXiv reaDer
自己教師ありモデルの表現品質を理解する
Understanding Representation Quality in Self-Supervised Models
自己教師あり学習は、下流の分類タスクで印象的な結果を示しています。ただし、障害モードを理解し、学習した表現を解釈する作業は限られています。この論文では、SimCLR、SwaV、MoCo、BYOL、DINO、SimSiam を含む 6 つの最先端の自己教師ありモデルの表現空間を調べます。クラス ラベル情報を使用せずに、画像内の一意の物理的属性に対応し、ほとんどが正しく分類された表現に存在する高度に活性化する機能を発見します。これらの機能を使用して、線形評価中に特定のサンプルが誤分類される可能性があるかどうかを確実に予測できる、モデルに依存しない教師なしスコアである自己教師あり表現品質スコア (または Q スコア) を提案し、91.45 の AUPRC を達成します。 ImageNet-1K 上の ImageNet-100 および 78.78。 Qスコアは、事前トレーニングの過程で低品質の表現を修正するために、任意の自己教師ありモデルの正則化用語としても使用できます。 Qスコア正則化を使用した事前トレーニングにより、ImageNet-1K、ImageNet-100、CIFAR-10、CIFAR-100、およびSTL-10で6つの最先端の自己教師ありモデルのパフォーマンスが向上することを示しています。線形評価で 1.8% のトップ 1 精度の平均相対増加。ベースラインと比較して、ImageNet-100 では BYOL が 7.2% の相対的な改善を示し、ImageNet-1K では SimCLR が 4.7% の相対的な改善を示しています。最後に、勾配ヒートマップと Salient ImageNet マスクを使用して、各表現の解釈可能性を定量化するメトリックを定義します。高度に活性化する機能はコア属性と強く相関しており、Qスコアの正則化を通じてこれらの機能を強化すると、すべての自己教師ありモデルの全体的な表現の解釈可能性が向上することを示しています。
Self-supervised learning has shown impressive results in downstream classification tasks. However, there is limited work in understanding their failure modes and interpreting their learned representations. In this paper, we study the representation space of six state-of-the-art self-supervised models including SimCLR, SwaV, MoCo, BYOL, DINO and SimSiam. Without the use of class label information, we discover highly activating features that correspond to unique physical attributes in images and exist mostly in correctly-classified representations. Using these features, we propose Self-Supervised Representation Quality Score (or Q-Score), a model-agnostic, unsupervised score that can reliably predict if a given sample is likely to be mis-classified during linear evaluation, achieving AUPRC of 91.45 on ImageNet-100 and 78.78 on ImageNet-1K. Q-Score can also be used as a regularization term on any self-supervised model to remedy low-quality representations through the course of pre-training. We show that pre-training with Q-Score regularization can boost the performance of six state-of-the-art self-supervised models on ImageNet-1K, ImageNet-100, CIFAR-10, CIFAR-100 and STL-10, showing an average relative increase of 1.8% top-1 accuracy on linear evaluation. On ImageNet-100, BYOL shows 7.2% relative improvement and on ImageNet-1K, SimCLR shows 4.7% relative improvement compared to their baselines. Finally, using gradient heatmaps and Salient ImageNet masks, we define a metric to quantify the interpretability of each representation. We show that highly activating features are strongly correlated to core attributes and enhancing these features through Q-score regularization improves the overall representation interpretability for all self-supervised models.
updated: Wed Jan 04 2023 23:00:34 GMT+0000 (UTC)
published: Thu Mar 03 2022 17:48:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト