本稿では、深層畳み込みニューラルネットワークの推論に部分的な証拠を組み込む新しい方法を提案します。ネットワークの入力を繰り返し変更するか、部分的な証拠を考慮するために外部ラベル分類を活用する既存の最高のパフォーマンスの方法とは異なり、事前の中間層に個別のネットワークモジュール(「プラグインネットワーク」)を追加します。訓練された畳み込みネットワーク。これらのモジュールの目的は、追加の信号、つまり既知のラベルに関する情報を推論手順に組み込み、それに応じて予測出力を調整することです。接続されたプラグインは、完全に接続されたレイヤーのみで構成される単純な構造を持っているため、トレーニングと推論の計算コストを大幅に削減しました。同時に、提案されたアーキテクチャにより、既知のラベルに関する情報を中間層に直接伝播して、最終的な表現を改善できます。提案された方法の広範な評価により、プラグインネットワークは、シーンの分類、マルチラベル画像の注釈、セマンティックセグメンテーションなど、さまざまなタスクで最先端技術よりも優れていることが確認されました。
In this paper, we propose a novel method to incorporate partial evidence in the inference of deep convolutional neural networks. Contrary to the existing, top performing methods, which either iteratively modify the input of the network or exploit external label taxonomy to take the partial evidence into account, we add separate network modules ("Plugin Networks") to the intermediate layers of a pre-trained convolutional network. The goal of these modules is to incorporate additional signal, ie information about known labels, into the inference procedure and adjust the predicted output accordingly. Since the attached plugins have a simple structure, consisting of only fully connected layers, we drastically reduced the computational cost of training and inference. At the same time, the proposed architecture allows to propagate information about known labels directly to the intermediate layers to improve the final representation. Extensive evaluation of the proposed method confirms that our Plugin Networks outperform the state-of-the-art in a variety of tasks, including scene categorization, multi-label image annotation, and semantic segmentation.