arXiv reaDer
少数ショットセグメンテーションのための超相関スクイーズ
Hypercorrelation Squeeze for Few-Shot Segmentation
数ショットのセマンティックセグメンテーションは、ターゲットクラスのいくつかの注釈付きサポート画像のみを使用して、クエリ画像からターゲットオブジェクトをセグメント化することを学習することを目的としています。このやりがいのあるタスクでは、さまざまなレベルの視覚的な手がかりを理解し、クエリとサポート画像の間のきめ細かい対応関係を分析する必要があります。この問題に対処するために、マルチレベルの特徴相関と効率的な4D畳み込みを活用するHypercorrelation Squeeze Networks(HSNet)を提案します。さまざまなレベルの中間畳み込み層から多様な特徴を抽出し、4D相関テンソルのコレクション、つまり超相関を構築します。ピラミッド型アーキテクチャで効率的なセンターピボット4D畳み込みを使用して、このメソッドは、ハイパー相関の高レベルのセマンティックおよび低レベルの幾何学的キューを、粗い方法から細かい方法で正確なセグメンテーションマスクに徐々に絞り込みます。 PASCAL-5i、COCO-20i、およびFSS-1000の標準的な数ショットセグメンテーションベンチマークの大幅なパフォーマンスの向上により、提案された方法の有効性が検証されます。
Few-shot semantic segmentation aims at learning to segment a target object from a query image using only a few annotated support images of the target class. This challenging task requires to understand diverse levels of visual cues and analyze fine-grained correspondence relations between the query and the support images. To address the problem, we propose Hypercorrelation Squeeze Networks (HSNet) that leverages multi-level feature correlation and efficient 4D convolutions. It extracts diverse features from different levels of intermediate convolutional layers and constructs a collection of 4D correlation tensors, i.e., hypercorrelations. Using efficient center-pivot 4D convolutions in a pyramidal architecture, the method gradually squeezes high-level semantic and low-level geometric cues of the hypercorrelation into precise segmentation masks in coarse-to-fine manner. The significant performance improvements on standard few-shot segmentation benchmarks of PASCAL-5i, COCO-20i, and FSS-1000 verify the efficacy of the proposed method.
updated: Thu Oct 14 2021 18:27:04 GMT+0000 (UTC)
published: Sun Apr 04 2021 05:27:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト