領域類似性表現学習(ReSim)を紹介します。これは、オブジェクトの検出やセグメンテーションなどのローカリゼーションベースのタスクのための自己教師あり表現学習への新しいアプローチです。既存の作業は、画像全体のグローバル表現の学習のみに主に焦点を当てていますが、ReSimは、ローカリゼーションのための地域表現とセマンティック画像レベルの表現の両方を学習します。 ReSimは、固定サイズのウィンドウを2つのビュー(画像の切り抜きなど)の重なり合う領域全体にスライドさせ、これらの領域を対応する畳み込み特徴マップ領域に位置合わせしてから、ビュー間の特徴の類似性を最大化することで動作します。その結果、ReSimは、ニューラルネットワークの畳み込み特徴マップ全体で空間的および意味的に一貫した特徴表現を学習します。画像領域のシフトまたはスケール、例えば、オブジェクトのシフトまたはスケールは、特徴マップに対応する変化を有する。これにより、ダウンストリームタスクはこれらの表現をローカリゼーションに活用できます。オブジェクト検出、インスタンスセグメンテーション、高密度ポーズ推定実験を通じて、ReSimが、競合するMoCo-v2ベースラインと比較してローカリゼーションと分類のパフォーマンスを大幅に向上させる表現を学習する方法を示します:+2.7 AP ^ bb_75 VOC、+ 1.1 AP ^ bb_75 COCO、および+ 1.9AP ^ mk都市景観。コードと事前トレーニング済みモデルは、https://github.com/Tete-Xiao/ReSimでリリースされています。
We present Region Similarity Representation Learning (ReSim), a new approach to self-supervised representation learning for localization-based tasks such as object detection and segmentation. While existing work has largely focused on solely learning global representations for an entire image, ReSim learns both regional representations for localization as well as semantic image-level representations. ReSim operates by sliding a fixed-sized window across the overlapping area between two views (e.g., image crops), aligning these areas with their corresponding convolutional feature map regions, and then maximizing the feature similarity across views. As a result, ReSim learns spatially and semantically consistent feature representation throughout the convolutional feature maps of a neural network. A shift or scale of an image region, e.g., a shift or scale of an object, has a corresponding change in the feature maps; this allows downstream tasks to leverage these representations for localization. Through object detection, instance segmentation, and dense pose estimation experiments, we illustrate how ReSim learns representations which significantly improve the localization and classification performance compared to a competitive MoCo-v2 baseline: +2.7 AP^bb_75 VOC, +1.1 AP^bb_75 COCO, and +1.9 AP^mk Cityscapes. Code and pre-trained models are released at: https://github.com/Tete-Xiao/ReSim