Attending Category Disentangled Global Context for Image Classification
この論文では、アテンションメカニズムとグローバルコンテキストを使用した画像分類の一般的なフレームワークを提案します。これは、さまざまなネットワークアーキテクチャに組み込んで、パフォーマンスを向上させることができます。グローバルコンテキストの機能を調査するために、4つの数学モデルを比較し、カテゴリが解きほぐされた条件付き生成モデルにエンコードされたグローバルコンテキストを観察すると、「タスクに無関係なものを知ると、関連するものもわかる」というガイダンスが得られます。この観察に基づいて、新しいカテゴリDisentangled Global Context(CDGC)を定義し、それを取得するための深いネットワークを考案します。 CDGCに参加することで、ベースラインネットワークは対象のオブジェクトをより正確に識別できるため、パフォーマンスが向上します。フレームワークを多くの異なるネットワークアーキテクチャに適用し、4つの公開されているデータセットの最新技術と比較します。広範な結果は、私たちのアプローチの有効性と優位性を検証します。コードは、紙の承認時に公開されます。
In this paper, we propose a general framework for image classification using the attention mechanism and global context, which could incorporate with various network architectures to improve their performance. To investigate the capability of the global context, we compare four mathematical models and observe the global context encoded in the category disentangled conditional generative model could give more guidance as "know what is task irrelevant will also know what is relevant". Based on this observation, we define a novel Category Disentangled Global Context (CDGC) and devise a deep network to obtain it. By attending CDGC, the baseline networks could identify the objects of interest more accurately, thus improving the performance. We apply the framework to many different network architectures and compare with the state-of-the-art on four publicly available datasets. Extensive results validate the effectiveness and superiority of our approach. Code will be made public upon paper acceptance.
updated: Tue Jun 07 2022 15:09:53 GMT+0000 (UTC)
published: Mon Dec 17 2018 09:17:45 GMT+0000 (UTC)
