Adaptive Context Network for Scene Parsing
 最近の作品では、さまざまなレベルのコンテキストを調査することでシーンの解析パフォーマンスを改善し、通常、すべてのピクセルにわたって有用なコンテキストを均等に活用するように適切に設計された畳み込みネットワークをトレーニングします。ただし、このホワイトペーパーでは、各画像の異なるピクセルまたは領域によって、コンテキストの要求が異なることがわかります。この観察に基づいて、異なるピクセルごとの要求に応じてグローバルコンテキストとローカルコンテキストの競合融合によりピクセル認識コンテキストをキャプチャするために、適応コンテキストネットワーク(ACNet)を提案します。具体的には、ピクセルが与えられると、グローバルコンテキストデマンドはグローバルフィーチャとそのローカルフィーチャ間の類似性によって測定され、その逆の値を使用してローカルコンテキストデマンドを測定できます。提案されたグローバルコンテキストモジュールとローカルコンテキストモジュールによる2つの需要測定をそれぞれモデル化して、適応コンテキスト機能を生成します。さらに、複数のこのようなモジュールをインポートして、ネットワークの異なるレベルでいくつかの適応コンテキストブロックを構築し、粗から密の結果を取得します。最後に、包括的な実験的評価により、提案されたACNetの有効性が実証され、4つの公開データセットすべて、つまりCityscapes、ADE20K、PASCAL Context、COCO Stuffで新しい最先端のパフォーマンスが達成されました。
Recent works attempt to improve scene parsing performance by exploring different levels of contexts, and typically train a well-designed convolutional network to exploit useful contexts across all pixels equally. However, in this paper, we find that the context demands are varying from different pixels or regions in each image. Based on this observation, we propose an Adaptive Context Network (ACNet) to capture the pixel-aware contexts by a competitive fusion of global context and local context according to different per-pixel demands. Specifically, when given a pixel, the global context demand is measured by the similarity between the global feature and its local feature, whose reverse value can be used to measure the local context demand. We model the two demand measurements by the proposed global context module and local context module, respectively, to generate adaptive contextual features. Furthermore, we import multiple such modules to build several adaptive context blocks in different levels of network to obtain a coarse-to-fine result. Finally, comprehensive experimental evaluations demonstrate the effectiveness of the proposed ACNet, and new state-of-the-arts performances are achieved on all four public datasets, i.e. Cityscapes, ADE20K, PASCAL Context, and COCO Stuff.
updated: Tue Nov 05 2019 08:16:28 GMT+0000 (UTC)
published: Tue Nov 05 2019 08:16:28 GMT+0000 (UTC)
