自己教師あり学習は、ラベルのないデータを使用して適切な表現を学習することを目的としています。最近の研究では、大きなモデルは小さなモデルよりも自己教師あり学習の恩恵を受けることが示されています。その結果、大規模なモデルでは、教師あり学習と自己教師あり学習のギャップが大幅に縮小されました。この作業では、自己教師あり学習用の新しい疑似タスクを設計する代わりに、すでに学習した深い自己教師ありモデル(教師)をより小さなモデル(学生)に圧縮するモデル圧縮方法を開発します。教師の埋め込みスペース内のデータポイント間の相対的な類似性を模倣するように、学生モデルをトレーニングします。 AlexNetの場合、私たちの方法は、ImageNet線形評価(56.5%と比較して59.0%)および最近傍評価(41.4%と比較して50.7%)で完全に教師ありモデルを含む以前のすべての方法よりも優れています。私たちの知る限り、自己監視型AlexNetがImageNet分類で教師あり型を上回ったのはこれが初めてです。私たちのコードはここから入手できます:https://github.com/UMBCvision/CompRess
Self-supervised learning aims to learn good representations with unlabeled data. Recent works have shown that larger models benefit more from self-supervised learning than smaller models. As a result, the gap between supervised and self-supervised learning has been greatly reduced for larger models. In this work, instead of designing a new pseudo task for self-supervised learning, we develop a model compression method to compress an already learned, deep self-supervised model (teacher) to a smaller one (student). We train the student model so that it mimics the relative similarity between the data points in the teacher's embedding space. For AlexNet, our method outperforms all previous methods including the fully supervised model on ImageNet linear evaluation (59.0% compared to 56.5%) and on nearest neighbor evaluation (50.7% compared to 41.4%). To the best of our knowledge, this is the first time a self-supervised AlexNet has outperformed supervised one on ImageNet classification. Our code is available here: https://github.com/UMBCvision/CompRess