arXiv reaDer
自己管理学習の失敗モードを理解する
Understanding Failure Modes of Self-Supervised Learning
自己監視学習法は、下流の分類タスクで印象的な結果を示しています。ただし、障害モデルを理解し、これらのモデルの学習された表現を解釈する作業は限られています。この論文では、これらの問題に取り組み、下流のタスクにおける誤分類の根本的な理由を理解することにより、自己監視モデルの表現空間を研究します。 SimCLR、SwaV、MoCo V2、BYOLなど、いくつかの最先端の自己監視モデルで、正しく分類されたサンプルの表現には、他の機能と比較して値が大きく異なる識別機能がほとんどないことがわかります。これは、誤って分類されたサンプルの表現とは明らかに対照的です。また、表現空間のノイズの多い特徴は、画像の偽の属性に対応することが多く、モデルの解釈が困難になることもわかりました。これらの観察に基づいて、ラベル情報にアクセスせずに、特定のサンプルがダウンストリームタスクで誤分類される可能性があるかどうかを予測できる、サンプルごとの自己監視表現品質スコア(またはQスコア)を提案します。 、最大0.90のAUPRCを達成します。 Qスコアは、低品質の表現を修正するための正則化としても使用でき、ImageNet-100でのSimCLRの精度が3.26%向上します。さらに、Qスコアの正則化により表現のスパース性が向上し、勾配ヒートマップを通じてノイズが減少し、解釈可能性が向上することを示します。
Self-supervised learning methods have shown impressive results in downstream classification tasks. However, there is limited work in understanding their failure models and interpreting the learned representations of these models. In this paper, we tackle these issues and study the representation space of self-supervised models by understanding the underlying reasons for misclassifications in a downstream task. Over several state-of-the-art self-supervised models including SimCLR, SwaV, MoCo V2 and BYOL, we observe that representations of correctly classified samples have few discriminative features with highly deviated values compared to other features. This is in a clear contrast with representations of misclassified samples. We also observe that noisy features in the representation space often correspond to spurious attributes in images making the models less interpretable. Building on these observations, we propose a sample-wise Self-Supervised Representation Quality Score (or, Q-Score) that, without access to any label information, is able to predict if a given sample is likely to be misclassified in the downstream task, achieving an AUPRC of up to 0.90. Q-Score can also be used as a regularization to remedy low-quality representations leading to 3.26% relative improvement in accuracy of SimCLR on ImageNet-100. Moreover, we show that Q-Score regularization increases representation sparsity, thus reducing noise and improving interpretability through gradient heatmaps.
updated: Thu Mar 03 2022 17:48:23 GMT+0000 (UTC)
published: Thu Mar 03 2022 17:48:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト