arXiv reaDer
対照的なマスク予測による自己教師あり視覚表現学習
Self-Supervised Visual Representations Learning by Contrastive Mask Prediction
高度な自己教師あり視覚表現学習方法は、インスタンス識別(ID)口実タスクに依存しています。 IDタスクには暗黙のセマンティック整合性(SC)の仮定があり、制約のないデータセットには当てはまらない可能性があることを指摘します。この論文では、視覚表現学習のための新しいコントラストマスク予測(CMP)タスクを提案し、アイデアを実装するためのマスクコントラスト(MaskCo)フレームワークを設計します。 MaskCoは、ビューレベルの機能ではなく領域レベルの機能を対比します。これにより、仮定なしでポジティブサンプルを識別できます。マスクされた機能とマスクされていない機能の間のドメインギャップを解決するために、MaskCoで専用のマスク予測ヘッドを設計します。このモジュールは、CMPの成功の鍵であることが示されています。 ImageNet以外のトレーニングデータセットでMaskCoを評価し、そのパフォーマンスをMoCoV2と比較しました。結果は、MaskCoがImageNetトレーニングデータセットを使用してMoCo V2と同等のパフォーマンスを達成することを示していますが、COCOまたはConceptual Captionsをトレーニングに使用すると、さまざまなダウンストリームタスクでより強力なパフォーマンスを示します。 MaskCoは、野生での自己教師あり学習のためのIDベースの方法に代わる有望な方法を提供します。
Advanced self-supervised visual representation learning methods rely on the instance discrimination (ID) pretext task. We point out that the ID task has an implicit semantic consistency (SC) assumption, which may not hold in unconstrained datasets. In this paper, we propose a novel contrastive mask prediction (CMP) task for visual representation learning and design a mask contrast (MaskCo) framework to implement the idea. MaskCo contrasts region-level features instead of view-level features, which makes it possible to identify the positive sample without any assumptions. To solve the domain gap between masked and unmasked features, we design a dedicated mask prediction head in MaskCo. This module is shown to be the key to the success of the CMP. We evaluated MaskCo on training datasets beyond ImageNet and compare its performance with MoCo V2. Results show that MaskCo achieves comparable performance with MoCo V2 using ImageNet training dataset, but demonstrates a stronger performance across a range of downstream tasks when COCO or Conceptual Captions are used for training. MaskCo provides a promising alternative to the ID-based methods for self-supervised learning in the wild.
updated: Wed Aug 18 2021 02:50:33 GMT+0000 (UTC)
published: Wed Aug 18 2021 02:50:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト