この論文では、一般化されたオープンセットセマンティックセグメンテーション(GOSS)と呼ばれる新しい画像セグメンテーションタスクを提示して研究します。以前は、よく知られているオープンセットセマンティックセグメンテーション(OSS)を使用すると、インテリジェントエージェントは未知の領域のみを検出し、それ以上の処理を行わず、環境の認識を制限していました。検出された未知のピクセルをさらに分析することが有益であることは当然のことです。したがって、2つの明確に定義されたセグメンテーションタスク、OSSとジェネリックセグメンテーション(GS)の機能を全体的な方法で統合するGOSSを提案します。具体的には、GOSSはピクセルを既知のクラスに属するものとして分類し、未知のクラスのピクセルのクラスター(またはグループ)はそのようにラベル付けされます。この新しく拡張されたタスクを評価するために、ピクセル分類とクラスタリングの側面のバランスをとるメトリックをさらに提案します。さらに、既存のデータセットの上にベンチマークテストを構築し、ベースラインとして単純なニューラルアーキテクチャを提案します。これは、オープンセット設定でのピクセル分類とクラスタリングを共同で予測します。複数のベンチマークでの実験は、ベースラインの有効性を示しています。私たちの新しいGOSSタスクは、将来の研究のために表現力豊かなイメージの理解を生み出すことができると信じています。コードが利用可能になります。
In this paper, we present and study a new image segmentation task, called Generalized Open-set Semantic Segmentation (GOSS). Previously, with the well-known open-set semantic segmentation (OSS), the intelligent agent only detects the unknown regions without further processing, limiting their perception of the environment. It stands to reason that a further analysis of the detected unknown pixels would be beneficial. Therefore, we propose GOSS, which unifies the abilities of two well-defined segmentation tasks, OSS and generic segmentation (GS), in a holistic way. Specifically, GOSS classifies pixels as belonging to known classes, and clusters (or groups) of pixels of unknown class are labelled as such. To evaluate this new expanded task, we further propose a metric which balances the pixel classification and clustering aspects. Moreover, we build benchmark tests on top of existing datasets and propose a simple neural architecture as a baseline, which jointly predicts pixel classification and clustering under open-set settings. Our experiments on multiple benchmarks demonstrate the effectiveness of our baseline. We believe our new GOSS task can produce an expressive image understanding for future research. Code will be made available.