arXiv reaDer
視覚表現の教師なし学習のための対照的な方法の再考
Revisiting Contrastive Methods for Unsupervised Learning of Visual Representations
対照的な教師あり学習は、セグメンテーションやオブジェクト検出などの多くのダウンストリームタスクで教師あり事前トレーニングを上回っています。ただし、現在の方法は、主にImageNetなどのキュレーションされたデータセットに適用されます。この論文では、最初にデータセットのバイアスが既存の方法にどのように影響するかを研究します。私たちの結果は、現在の対照的なアプローチが、(i)オブジェクト中心とシーン中心、(ii)均一とロングテール、(iii)一般とドメイン固有のデータセット全体で驚くほどうまく機能することを示しています。第二に、アプローチの一般性を考慮して、マイナーな変更でさらなる利益を実現しようとします。マルチスケールのトリミング、より強力な拡張、最近傍の使用を通じて、追加の不変性を学習すると、表現が改善されることを示します。最後に、MoCoは、マルチクロップ戦略でトレーニングされたときに、空間的に構造化された表現を学習することを観察します。表現は、微調整することなく、セマンティックセグメントの取得とビデオインスタンスのセグメンテーションに使用できます。さらに、結果は特殊なモデルと同等です。この研究が他の研究者にとって有用な研究となることを願っています。コードとモデルはhttps://github.com/wvangansbeke/Revisiting-Contrastive-SSLで入手できます。
Contrastive self-supervised learning has outperformed supervised pretraining on many downstream tasks like segmentation and object detection. However, current methods are still primarily applied to curated datasets like ImageNet. In this paper, we first study how biases in the dataset affect existing methods. Our results show that current contrastive approaches work surprisingly well across: (i) object- versus scene-centric, (ii) uniform versus long-tailed and (iii) general versus domain-specific datasets. Second, given the generality of the approach, we try to realize further gains with minor modifications. We show that learning additional invariances -- through the use of multi-scale cropping, stronger augmentations and nearest neighbors -- improves the representations. Finally, we observe that MoCo learns spatially structured representations when trained with a multi-crop strategy. The representations can be used for semantic segment retrieval and video instance segmentation without finetuning. Moreover, the results are on par with specialized models. We hope this work will serve as a useful study for other researchers. The code and models are available at https://github.com/wvangansbeke/Revisiting-Contrastive-SSL.
updated: Thu Oct 21 2021 11:09:00 GMT+0000 (UTC)
published: Thu Jun 10 2021 17:59:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト