教師なし表現学習の一般的な方法は、ラベル付きデータを使用して、学習した表現の品質を評価することです。次に、この監視された評価を使用して、データ拡張ポリシーの選択など、トレーニングプロセスの重要な側面をガイドします。ただし、教師あり評価を通じて教師なしトレーニングプロセスをガイドすることは、実際にはラベルが含まれていない実際のデータでは不可能です(たとえば、医用画像などのプライバシーに敏感な分野の場合など)。したがって、この作業では、自己教師あり画像回転タスクを使用して学習した表現を評価することは、教師あり評価の標準セットと高度に相関していることを示します(順位相関> 0.94)。何百もの拡張ポリシー、トレーニング設定、およびネットワークアーキテクチャにわたってこの相関関係を確立し、監視された評価を使用せずに拡張ポリシーを自動的かつ効率的に選択するアルゴリズム(SelfAugment)を提供します。ラベル付けされたデータを使用していないにもかかわらず、学習された拡張ポリシーは、徹底的な教師あり評価を使用して決定された拡張ポリシーと同等に機能します。
A common practice in unsupervised representation learning is to use labeled data to evaluate the quality of the learned representations. This supervised evaluation is then used to guide critical aspects of the training process such as selecting the data augmentation policy. However, guiding an unsupervised training process through supervised evaluations is not possible for real-world data that does not actually contain labels (which may be the case, for example, in privacy sensitive fields such as medical imaging). Therefore, in this work we show that evaluating the learned representations with a self-supervised image rotation task is highly correlated with a standard set of supervised evaluations (rank correlation > 0.94). We establish this correlation across hundreds of augmentation policies, training settings, and network architectures and provide an algorithm (SelfAugment) to automatically and efficiently select augmentation policies without using supervised evaluations. Despite not using any labeled data, the learned augmentation policies perform comparably with augmentation policies that were determined using exhaustive supervised evaluations.