arXiv reaDer
Swin Transformersによる自己教師付き学習
Self-Supervised Learning with Swin Transformers
コンピュータビジョンの分野では、CNNからトランスフォーマーへのモデリングの移行が進んでいる。本論文では、視覚トランスフォーマーをバックボーン・アーキテクチャとするMoBYと呼ばれる自己教師付き学習アプローチを紹介する。このアプローチは基本的にMoCo v2とBYOLを組み合わせたものであり、ImageNet-1Kの線形評価において適度に高い精度を達成するように調整されている。300エポックの学習により、DeiT-SとSwin-Tを用いて、それぞれ72.8%と75.0%のトップ1精度を達成している。この性能は、DeiTをバックボーンとして採用しているMoCo v3やDINOなどの最近の研究よりも、より軽いトリックしか使わず、わずかに優れている。さらに重要なことは、汎用的なSwin Transformerをバックボーンとすることで、物体検出や意味分割などの下流のタスクでも学習した表現を評価できることである。今回の結果が、トランスフォーマーアーキテクチャ用に設計された自己教師付き学習手法のより包括的な評価につながることを期待している。私たちのコードとモデルは、https://github.com/SwinTransformer/Transformer-SSL で公開されており、今後も継続的に充実させていく予定である。
We are witnessing a modeling shift from CNN to Transformers in computer vision. In this paper, we present a self-supervised learning approach called MoBY, with Vision Transformers as its backbone architecture. The approach is basically a combination of MoCo v2 and BYOL, tuned to achieve reasonably high accuracy on ImageNet-1K linear evaluation: 72.8% and 75.0% top-1 accuracy using DeiT-S and Swin-T, respectively, by 300-epoch training. The performance is slightly better than recent works of MoCo v3 and DINO which adopt DeiT as the backbone, but with much lighter tricks. More importantly, the general-purpose Swin Transformer backbone enables us to also evaluate the learnt representations on downstream tasks such as object detection and semantic segmentation, in contrast to a few recent approaches built on ViT/DeiT which only report linear evaluation results on ImageNet-1K due to ViT/DeiT not tamed for these dense prediction tasks. We hope our results can facilitate more comprehensive evaluation of self-supervised learning methods designed for Transformer architectures. Our code and models are available at https://github.com/SwinTransformer/Transformer-SSL, which will be continually enriched.
updated: Mon May 10 2021 17:59:45 GMT+0000 (UTC)
published: Mon May 10 2021 17:59:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト