arXiv reaDer
注意メカニズムの有効性の理解に向けて
Towards Understanding the Effectiveness of Attention Mechanism
アテンションメカニズムは、コンピュータービジョンタスクで畳み込みニューラルネットワーク(CNN)のパフォーマンスを向上させるために広く使用されている方法です。その普及にもかかわらず、私たちはその有効性が何から生じるのかについての理解が不十分です。その有効性は、入力全体を取り込むのではなく、入力データの重要な部分に焦点を当てることを提唱する視覚的注意の説明に由来すると一般に信じられています。この論文では、特徴の注意の重みとそれらの重要性の間には弱い一貫性しかないことがわかりました。代わりに、注意メカニズムにおける特徴マップ乗算の重要な役割を検証し、CNNの学習されたランドスケープに対する特徴マップ乗算の基本的な影響を明らかにします。特徴マップ乗算によってもたらされる高次の非線形性により、 CNNは、バニラCNNと比較して、実際のサンプルの近くでよりスムーズで安定した風景を学習できるようにしました。この滑らかさと安定性により、実際のサンプル間でより予測的で安定した動作が誘発され、CNNの生成が向上します。さらに、提案された特徴マップ乗算の有効性に動機付けられて、ResNetの特徴マップ追加を特徴マップ乗算に置き換えるだけで、特徴マップ乗算ネットワーク(FMMNet)を設計します。 FMMNetは、さまざまなデータセットでResNetよりも優れています。これは、既存の方法で細かく設計された注意メカニズムがなくても、特徴マップの乗算がパフォーマンスの向上に重要な役割を果たしていることを示しています。
Attention Mechanism is a widely used method for improving the performance of convolutional neural networks (CNNs) on computer vision tasks. Despite its pervasiveness, we have a poor understanding of what its effectiveness stems from. It is popularly believed that its effectiveness stems from the visual attention explanation, advocating focusing on the important part of input data rather than ingesting the entire input. In this paper, we find that there is only a weak consistency between the attention weights of features and their importance. Instead, we verify the crucial role of feature map multiplication in attention mechanism and uncover a fundamental impact of feature map multiplication on the learned landscapes of CNNs: with the high order non-linearity brought by the feature map multiplication, it played a regularization role on CNNs, which made them learn smoother and more stable landscapes near real samples compared to vanilla CNNs. This smoothness and stability induce a more predictive and stable behavior in-between real samples, and make CNNs generate better. Moreover, motivated by the proposed effectiveness of feature map multiplication, we design feature map multiplication network (FMMNet) by simply replacing the feature map addition in ResNet with feature map multiplication. FMMNet outperforms ResNet on various datasets, and this indicates that feature map multiplication plays a vital role in improving the performance even without finely designed attention mechanism in existing methods.
updated: Tue Jun 29 2021 02:58:59 GMT+0000 (UTC)
published: Tue Jun 29 2021 02:58:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト