arXiv reaDer
パノプティコン、インスタンス、およびセマンティック関係:パノプティコンセグメンテーションを強化するためのリレーショナルコンテキストエンコーダ
Panoptic, Instance and Semantic Relations: A Relational Context Encoder to Enhance Panoptic Segmentation
このホワイトペーパーでは、パノプティコンセグメンテーションのセマンティックコンテキストとインスタンスコンテキストの両方を統合するための新しいフレームワークを紹介します。既存の作品では、共有バックボーンを使用して、物(車両などの数えられるクラス)ともの(道路などの数えられないクラス)の両方の特徴を抽出するのが一般的です。ただし、これでは、それらの間の豊富な関係を捉えることができず、視覚的な理解とセグメンテーションのパフォーマンスを向上させるために利用できます。この欠点に対処するために、このようなコンテキストを活用するための新しいPanoptic、Instance、およびSemantic Relations(PISR)モジュールを提案します。まず、セマンティッククラスと予測インスタンスの主要な機能を要約するパノラマエンコーディングを生成します。次に、Panoptic Relational Attention(PRA)モジュールが、バックボーンからのエンコーディングとグローバル機能マップに適用されます。これは、1)セマンティッククラスとインスタンス間の関係、および2)これらのパノラマカテゴリと空間特徴の間の関係をキャプチャする特徴マップを生成します。 PISRはまた、より重要なインスタンスに焦点を当てることを自動的に学習し、リレーショナルアテンションモジュールで使用されるインスタンスの数に対して堅牢になります。さらに、PISRは、既存のパノラマセグメンテーションアーキテクチャに適用できる一般的なモジュールです。 Cityscapes、COCO、ADE20Kなどのパノラマセグメンテーションベンチマークの広範な評価を通じて、PISRが既存のアプローチよりも大幅に改善されていることを示しています。
This paper presents a novel framework to integrate both semantic and instance contexts for panoptic segmentation. In existing works, it is common to use a shared backbone to extract features for both things (countable classes such as vehicles) and stuff (uncountable classes such as roads). This, however, fails to capture the rich relations among them, which can be utilized to enhance visual understanding and segmentation performance. To address this shortcoming, we propose a novel Panoptic, Instance, and Semantic Relations (PISR) module to exploit such contexts. First, we generate panoptic encodings to summarize key features of the semantic classes and predicted instances. A Panoptic Relational Attention (PRA) module is then applied to the encodings and the global feature map from the backbone. It produces a feature map that captures 1) the relations across semantic classes and instances and 2) the relations between these panoptic categories and spatial features. PISR also automatically learns to focus on the more important instances, making it robust to the number of instances used in the relational attention module. Moreover, PISR is a general module that can be applied to any existing panoptic segmentation architecture. Through extensive evaluations on panoptic segmentation benchmarks like Cityscapes, COCO, and ADE20K, we show that PISR attains considerable improvements over existing approaches.
updated: Mon Apr 11 2022 19:15:41 GMT+0000 (UTC)
published: Mon Apr 11 2022 19:15:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト