arXiv reaDer
VisualTransformerに関する調査
A Survey on Visual Transformer
Transformerは、主に自然言語処理の分野で適用されている自己注意メカニズムに基づくディープニューラルネットワークの一種です。トランスフォーマーの強力な表現能力に触発されて、研究者はコンピュータービジョンタスクのためにトランスフォーマーを拡張することを提案しています。 Transformerベースのモデルは、畳み込みネットワークやリカレントネットワークなどの他のネットワークタイプと比較して、さまざまな視覚的ベンチマークで競争力があり、さらに優れたパフォーマンスを示します。高性能で、人間が定義する誘導バイアスがないため、トランスフォーマーはビジュアルコミュニティからますます注目を集めています。このホワイトペーパーでは、これらのビジュアルトランスフォーマーモデルをさまざまなタスクに分類して文献レビューを行い、これらの方法の長所と短所を分析します。特に、主なカテゴリには、基本的な画像分類、高レベルのビジョン、低レベルのビジョン、およびビデオ処理が含まれます。自己注意は変圧器の基本コンポーネントであるため、コンピュータビジョンの自己注意も簡単に再検討されます。トランスをデバイスの実際のアプリケーションにプッシュするための効率的なトランス方式が含まれています。最後に、ビジュアルトランスの課題とさらなる研究の方向性について説明します。
Transformer is a type of deep neural network mainly based on self-attention mechanism which is originally applied in natural language processing field. Inspired by the strong representation ability of transformer, researchers propose to extend transformer for computer vision tasks. Transformer-based models show competitive and even better performance on various visual benchmarks compared to other network types such as convolutional networks and recurrent networks. With high performance and without inductive bias defined by human, transformer is receiving more and more attention from the visual community. In this paper we provide a literature review of these visual transformer models by categorizing them in different tasks and analyze the advantages and disadvantages of these methods. In particular, the main categories include the basic image classification, high-level vision, low-level vision and video processing. The self-attention in computer vision is also briefly revisited as self-attention is the base component in transformer. Efficient transformer methods are included for pushing transformer into real applications on the devices. Finally, we give a discussion about the challenges and further research directions for visual transformers.
updated: Fri Jan 15 2021 07:09:36 GMT+0000 (UTC)
published: Wed Dec 23 2020 09:37:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト