arXiv reaDer
あなたも注意が必要ですか?フィードフォワード層のスタックは、ImageNetで驚くほどうまく機能します
Do You Even Need Attention? A Stack of Feed-Forward Layers Does Surprisingly Well on ImageNet
画像分類やその他の視覚タスクにおける視覚変換器の強力なパフォーマンスは、多くの場合、マルチヘッドアテンションレイヤーの設計に起因します。ただし、この強力なパフォーマンスの原因となる注意の程度は不明なままです。この短いレポートでは、次のように質問します。アテンションレイヤーは必要ですか?具体的には、ビジョントランスフォーマーのアテンションレイヤーを、パッチディメンションに適用されるフィードフォワードレイヤーに置き換えます。結果として得られるアーキテクチャは、パッチとフィーチャの次元に交互に適用される一連のフィードフォワード層です。 ImageNetでの実験では、このアーキテクチャは驚くほどうまく機能します。ViT/ DeiTベースサイズのモデルは、ViTとDeiTのそれぞれ77.9%と79.9%と比較して、74.9%のトップ1精度を取得します。これらの結果は、パッチの埋め込みなど、注意以外のビジョントランスフォーマーの側面が、以前に考えられていたよりも強力なパフォーマンスの原因である可能性があることを示しています。これらの結果により、コミュニティが現在のモデルが効果的である理由を理解するためにより多くの時間を費やすようになることを願っています。
The strong performance of vision transformers on image classification and other vision tasks is often attributed to the design of their multi-head attention layers. However, the extent to which attention is responsible for this strong performance remains unclear. In this short report, we ask: is the attention layer even necessary? Specifically, we replace the attention layer in a vision transformer with a feed-forward layer applied over the patch dimension. The resulting architecture is simply a series of feed-forward layers applied over the patch and feature dimensions in an alternating fashion. In experiments on ImageNet, this architecture performs surprisingly well: a ViT/DeiT-base-sized model obtains 74.9% top-1 accuracy, compared to 77.9% and 79.9% for ViT and DeiT respectively. These results indicate that aspects of vision transformers other than attention, such as the patch embedding, may be more responsible for their strong performance than previously thought. We hope these results prompt the community to spend more time trying to understand why our current models are as effective as they are.
updated: Thu May 06 2021 14:42:39 GMT+0000 (UTC)
published: Thu May 06 2021 14:42:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト