arXiv reaDer
A New Few-shot Segmentation Network Based on Class Representation
  このペーパーでは、少数のセグメンテーションを研究します。これは、既存の豊富なアノテーションのセットによって支援され、いくつかのアノテーションのみによって、見えないクラスの前景マスクを予測するタスクです。既存のメソッドは、主に「\ textit {サポート画像(ラベル付き画像)からクエリ画像(ラベルなし画像)にセグメンテーションキューを転送する方法」)に焦点を当て、見えないクラスに簡単に拡張できる効率的で一般的な転送モジュールを学習しようとします。ただし、さまざまなクラスに一般的な転送モジュールを学習することは、難しいタスクであることが証明されています。このペーパーでは、「\ textit {既存のクラスによる未表示のクラスの表示方法」の新しい観点で少数ショットのセグメンテーションを解決し、(前景の事前形成に関して)表示されないクラスを表す表示プロセスとして少数ショットのセグメンテーションを定式化します。既存のクラス。このような考えに基づいて、新しいクラス表現ベースの少数ショットセグメンテーションフレームワークを提案します。このフレームワークは、最初に既存のクラスの知識に基づいて目に見えないクラスのクラスアクティベーションマップを生成し、次にクエリをフォアグラウンド確率マップとして使用してクエリからフォアグラウンドを抽出します画像。新しい2分岐ベースの少数ショットセグメンテーションネットワークが提案されています。さらに、従来のトレーニングクラスではなく、目に見えないクラスのCAMを抽出する新しいCAM生成モジュールが作成されます。 Pascal VOC 2012データセットでのメソッドの有効性を検証します。1ショットと5ショットのFB-IoUの値はそれぞれ69.2 \%と70.1 \%に達し、最新の方法よりも優れています。
This paper studies few-shot segmentation, which is a task of predicting foreground mask of unseen classes by a few of annotations only, aided by a set of rich annotations already existed. The existing methods mainly focus the task on "\textit{how to transfer segmentation cues from support images (labeled images) to query images (unlabeled images)", and try to learn efficient and general transfer module that can be easily extended to unseen classes. However, it is proved to be a challenging task to learn the transfer module that is general to various classes. This paper solves few-shot segmentation in a new perspective of "\textit{how to represent unseen classes by existing classes", and formulates few-shot segmentation as the representation process that represents unseen classes (in terms of forming the foreground prior) by existing classes precisely. Based on such idea, we propose a new class representation based few-shot segmentation framework, which firstly generates class activation map of unseen class based on the knowledge of existing classes, and then uses the map as foreground probability map to extract the foregrounds from query image. A new two-branch based few-shot segmentation network is proposed. Moreover, a new CAM generation module that extracts the CAM of unseen classes rather than the classical training classes is raised. We validate the effectiveness of our method on Pascal VOC 2012 dataset, the value FB-IoU of one-shot and five-shot arrives at 69.2\% and 70.1\% respectively, which outperforms the state-of-the-art method.
updated: Thu Sep 19 2019 00:59:56 GMT+0000 (UTC)
published: Thu Sep 19 2019 00:59:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト