畳み込みニューラルネットワーク(CNN)の基本的な構成要素である畳み込み層は、ローカルパターンを抽出するように設計されており、その性質の中でグローバルコンテキストをモデル化する機能がありません。 CNNをグローバルモデリング機能で補完するために、特にグローバル機能の相互作用に関する一連の作業によって、多くの取り組みが最近行われました。これらの作業では、グローバルコンテキスト情報は、畳み込み層にフィードされる前にローカル機能に組み込まれます。しかし、神経科学の研究により、コンテキストに応じて動的に機能を変更するニューロンの能力は、ほとんどのCNNで見過ごされてきた知覚タスクに不可欠であることが明らかになりました。これを動機として、グローバルコンテキストのガイダンスの下で、畳み込み層の重みを適応的に明示的に変更する1つの新しいコンテキストゲート畳み込み(CGC)を提案します。このように、グローバルコンテキストを認識して、提案されたCGCの変調された畳み込みカーネルは、代表的なローカルパターンをより適切に抽出し、特徴的な特徴を構成できます。さらに、提案されたCGCは軽量で、最新のCNNアーキテクチャに適用可能であり、画像分類、アクション認識、機械翻訳に関する広範な実験によると、CNNのパフォーマンスを一貫して向上させます。このペーパーのコードは、https://github.com/XudongLinthu/context-gated-convolutionで入手できます。
As the basic building block of Convolutional Neural Networks (CNNs), the convolutional layer is designed to extract local patterns and lacks the ability to model global context in its nature. Many efforts have been recently devoted to complementing CNNs with the global modeling ability, especially by a family of works on global feature interaction. In these works, the global context information is incorporated into local features before they are fed into convolutional layers. However, research on neuroscience reveals that the neurons' ability of modifying their functions dynamically according to context is essential for the perceptual tasks, which has been overlooked in most of CNNs. Motivated by this, we propose one novel Context-Gated Convolution (CGC) to explicitly modify the weights of convolutional layers adaptively under the guidance of global context. As such, being aware of the global context, the modulated convolution kernel of our proposed CGC can better extract representative local patterns and compose discriminative features. Moreover, our proposed CGC is lightweight and applicable with modern CNN architectures, and consistently improves the performance of CNNs according to extensive experiments on image classification, action recognition, and machine translation. Our code of this paper is available at https://github.com/XudongLinthu/context-gated-convolution.