arXiv reaDer
MFNet:ピクセル単位のメトリック学習を備えたマルチクラスの少数ショットセグメンテーションネットワーク
MFNet: Multi-class Few-shot Segmentation Network with Pixel-wise Metric Learning
視覚認識タスクでは、数ショット学習には、サポート例がほとんどないオブジェクトカテゴリを学習する機能が必要です。ディープラーニングの開発に照らして最近復活したのは、主に画像の分類です。この作業は、まだほとんど未踏の分野である、数ショットのセマンティックセグメンテーションに焦点を当てています。最近のいくつかの進歩は、多くの場合、シングルクラスの数ショットのセグメンテーションに制限されています。この論文では、最初に、マルチスケールクエリ情報とマルチクラスサポート情報を1つのクエリサポート埋め込みに効果的に融合する、新しいマルチウェイエンコーディングおよびデコーディングアーキテクチャを紹介します。マルチクラスセグメンテーションは、この埋め込み時に直接デコードされます。より良い特徴融合のために、アーキテクチャ内でマルチレベルの注意メカニズムが提案されています。これには、サポート機能の変調に対する注意とマルチスケールの組み合わせに対する注意が含まれます。最後に、埋め込み空間学習を強化するために、入力画像のピクセルレベルの埋め込みで定式化されたトリプレット損失を使用して、追加のピクセル単位のメトリック学習モジュールが考案されています。標準ベンチマークPASCAL-5 ^ iおよびCOCO-20 ^ iでの広範な実験は、数ショットのセグメンテーションにおける最先端の方法に対する私たちの方法の明らかな利点を示しています。
In visual recognition tasks, few-shot learning requires the ability to learn object categories with few support examples. Its recent resurgence in light of the deep learning development is mainly in image classification. This work focuses on few-shot semantic segmentation, which is still a largely unexplored field. A few recent advances are often restricted to single-class few-shot segmentation. In this paper, we first present a novel multi-way encoding and decoding architecture which effectively fuses multi-scale query information and multi-class support information into one query-support embedding; multi-class segmentation is directly decoded upon this embedding. In order for better feature fusion, a multi-level attention mechanism is proposed within the architecture, which includes the attention for support feature modulation and attention for multi-scale combination. Last, to enhance the embedding space learning, an additional pixel-wise metric learning module is devised with triplet loss formulated on the pixel-level embedding of the input image. Extensive experiments on standard benchmarks PASCAL-5^i and COCO-20^i show clear benefits of our method over the state of the art in few-shot segmentation.
updated: Sat Oct 30 2021 11:37:36 GMT+0000 (UTC)
published: Sat Oct 30 2021 11:37:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト