arXiv reaDer
VisionTransformerの検索スペースの検索
Searching the Search Space of Vision Transformer
Vision Transformerは、認識や検出などの実質的な視覚タスクで優れた視覚表現力を示しており、より効果的なアーキテクチャを手動で設計することに急成長している取り組みを引き付けています。本論文では、アーキテクチャだけでなく検索空間も検索することにより、ニューラルアーキテクチャ検索を使用してこのプロセスを自動化することを提案します。中心的なアイデアは、重み共有スーパーネットを使用して計算されたETエラーによって導かれるさまざまな検索ディメンションを徐々に進化させることです。さらに、一般的なビジョントランスフォーマーの設計ガイドラインを提供し、スペース検索プロセスに従って広範な分析を行うことで、ビジョントランスフォーマーの理解を促進することができます。注目すべきことに、検索されたスペースからS3(Searching the Search Spaceの略)という名前の検索されたモデルは、ImageNetで評価したときに、Swin、DeiT、ViTなどの最近提案されたモデルよりも優れたパフォーマンスを実現します。 S3の有効性は、オブジェクト検出、セマンティックセグメンテーション、視覚的な質問応答でも示され、下流の視覚および視覚言語タスクに対する一般性を示しています。コードとモデルはhttps://github.com/microsoft/Creamで入手できます。
Vision Transformer has shown great visual representation power in substantial vision tasks such as recognition and detection, and thus been attracting fast-growing efforts on manually designing more effective architectures. In this paper, we propose to use neural architecture search to automate this process, by searching not only the architecture but also the search space. The central idea is to gradually evolve different search dimensions guided by their E-T Error computed using a weight-sharing supernet. Moreover, we provide design guidelines of general vision transformers with extensive analysis according to the space searching process, which could promote the understanding of vision transformer. Remarkably, the searched models, named S3 (short for Searching the Search Space), from the searched space achieve superior performance to recently proposed models, such as Swin, DeiT and ViT, when evaluated on ImageNet. The effectiveness of S3 is also illustrated on object detection, semantic segmentation and visual question answering, demonstrating its generality to downstream vision and vision-language tasks. Code and models will be available at https://github.com/microsoft/Cream.
updated: Mon Nov 29 2021 17:26:07 GMT+0000 (UTC)
published: Mon Nov 29 2021 17:26:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト