arXiv reaDer
MFNet:ピクセル単位のメトリック学習を備えたマルチクラスの数ショットセグメンテーションネットワーク
MFNet: Multi-class Few-shot Segmentation Network with Pixel-wise Metric Learning
視覚認識タスクでは、数ショットの学習には、サポート例がほとんどないオブジェクトカテゴリを学習する機能が必要です。ディープラーニングの開発に照らしたその再人気は、主に画像分類にあります。この作業は、まだほとんど未踏の分野である、数ショットのセマンティックセグメンテーションに焦点を当てています。最近のいくつかの進歩は、多くの場合、シングルクラスの数ショットのセグメンテーションに制限されています。この論文では、最初に、マルチスケールクエリ情報とマルチクラスサポート情報を1つのクエリサポート埋め込みに効果的に融合する、新しいマルチウェイ(クラス)エンコーディングおよびデコーディングアーキテクチャを紹介します。マルチクラスセグメンテーションは、この埋め込み時に直接デコードされます。より良い機能融合のために、アーキテクチャ内でマルチレベルの注意メカニズムが提案されています。これには、サポート機能の変調に対する注意とマルチスケールの組み合わせに対する注意が含まれます。最後に、埋め込み空間学習を強化するために、入力画像のピクセルレベルの埋め込みで定式化されたトリプレット損失を使用して、追加のピクセル単位のメトリック学習モジュールが導入されます。標準ベンチマークPASCAL-5iおよびCOCO-20iでの広範な実験は、数ショットのセグメンテーションにおける最先端の方法に対する私たちの方法の明らかな利点を示しています
In visual recognition tasks, few-shot learning requires the ability to learn object categories with few support examples. Its re-popularity in light of the deep learning development is mainly in image classification. This work focuses on few-shot semantic segmentation, which is still a largely unexplored field. A few recent advances are often restricted to single-class few-shot segmentation. In this paper, we first present a novel multi-way (class) encoding and decoding architecture which effectively fuses multi-scale query information and multi-class support information into one query-support embedding. Multi-class segmentation is directly decoded upon this embedding. For better feature fusion, a multi-level attention mechanism is proposed within the architecture, which includes the attention for support feature modulation and attention for multi-scale combination. Last, to enhance the embedding space learning, an additional pixel-wise metric learning module is introduced with triplet loss formulated on the pixel-level embedding of the input image. Extensive experiments on standard benchmarks PASCAL-5i and COCO-20i show clear benefits of our method over the state of the art in few-shot segmentation
updated: Thu Mar 10 2022 16:24:58 GMT+0000 (UTC)
published: Sat Oct 30 2021 11:37:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト