arXiv reaDer
少数ショットセグメンテーションのための階層的密相関蒸留
Hierarchical Dense Correlation Distillation for Few-Shot Segmentation
少数ショット セマンティック セグメンテーション (FSS) は、クラスに依存しないモデルを形成し、目に見えないクラスをほんの一握りの注釈でセグメント化することを目的としています。セマンティック機能とプロトタイプ表現に限定されていた以前の方法は、セグメンテーションの粒度が粗く、トレーニングセットのオーバーフィッティングに悩まされていました。この作業では、トランス アーキテクチャに基づいて、階層的に分離されたマッチング ネットワーク (HDMNet) マイニング ピクセル レベルのサポート相関を設計します。セルフアテンション モジュールは、クエリとサポート フィーチャ間のカスケード マッチングを実現する手段として、階層的な高密度フィーチャの確立を支援するために使用されます。さらに、トレインセットのオーバーフィッティングを削減し、粗い解像度からセマンティック対応を活用して細粒度のセグメンテーションを促進する相関抽出を導入するためのマッチングモジュールを提案します。私たちの方法は、実験でうまく機能します。 \coco~dataset の 1 ショット設定で 50.0% の mIoU を達成し、5 ショット セグメンテーションで 56.0% をそれぞれ達成しました。
Few-shot semantic segmentation (FSS) aims to form class-agnostic models segmenting unseen classes with only a handful of annotations. Previous methods limited to the semantic feature and prototype representation suffer from coarse segmentation granularity and train-set overfitting. In this work, we design Hierarchically Decoupled Matching Network (HDMNet) mining pixel-level support correlation based on the transformer architecture. The self-attention modules are used to assist in establishing hierarchical dense features, as a means to accomplish the cascade matching between query and support features. Moreover, we propose a matching module to reduce train-set overfitting and introduce correlation distillation leveraging semantic correspondence from coarse resolution to boost fine-grained segmentation. Our method performs decently in experiments. We achieve 50.0% mIoU on \coco~dataset one-shot setting and 56.0% on five-shot segmentation, respectively.
updated: Sun Mar 26 2023 08:13:12 GMT+0000 (UTC)
published: Sun Mar 26 2023 08:13:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト