ACFNet: Attentional Class Feature Network for Semantic Segmentation
  最近の作品は、より豊かなコンテキストを活用することにより、セマンティックセグメンテーションで大きな進歩を遂げており、そのほとんどは空間的な観点から設計されています。以前の作品とは対照的に、カテゴリの観点からグローバルコンテキストを抽出するクラスセンターの概念を提示します。このクラスレベルのコンテキストは、画像内の各クラスの全体的な表現を記述します。さらに、各ピクセルに応じて異なるクラスセンターを計算し、適応的に結合するための、ACF(Attentional Class Feature)モジュールという新しいモジュールを提案します。 ACFモジュールに基づいて、ACFモジュールと任意のオフセグメンテーションネットワーク(基本ネットワーク)で構成されるAttentional Class Feature Network(ACFNet)と呼ばれる粗から細へのセグメンテーションネットワークを導入します。このホワイトペーパーでは、2種類のベースネットワークを使用して、ACFNetの有効性を評価します。 Cityscapesデータセットで81.85%mIoUという新しい最先端のパフォーマンスを達成し、トレーニングに使用するのは細かく注釈を付けたデータのみです。
Recent works have made great progress in semantic segmentation by exploiting richer context, most of which are designed from a spatial perspective. In contrast to previous works, we present the concept of class center which extracts the global context from a categorical perspective. This class-level context describes the overall representation of each class in an image. We further propose a novel module, named Attentional Class Feature (ACF) module, to calculate and adaptively combine different class centers according to each pixel. Based on the ACF module, we introduce a coarse-to-fine segmentation network, called Attentional Class Feature Network (ACFNet), which can be composed of an ACF module and any off-the-shell segmentation network (base network). In this paper, we use two types of base networks to evaluate the effectiveness of ACFNet. We achieve new state-of-the-art performance of 81.85% mIoU on Cityscapes dataset with only finely annotated data used for training.
updated: Fri Oct 18 2019 02:01:35 GMT+0000 (UTC)
published: Fri Sep 20 2019 10:19:17 GMT+0000 (UTC)
