arXiv reaDer
Few-Shot Segmentation Without Meta-Learning: A Good Transductive Inference Is All You Need?
数ショットのセグメンテーションタスクで推論が実行される方法が、パフォーマンスに大きな影響を与えることを示します。これは、メタ学習パラダイムを支持する文献では見過ごされがちな側面です。 3つの補完的な項を含む新しい損失を最適化することにより、ラベルのないピクセルの統計を活用して、特定のクエリ画像のトランスダクティブ推論を導入します。i)ラベルの付いたサポートピクセルのクロスエントロピー。 ii)ラベルのないクエリ画像ピクセルの事後確率のシャノンエントロピー。 iii)予測された前景の比率に基づくグローバルなKL発散正則化。私たちの推論は抽出された特徴の単純な線形分類器を使用するため、その計算負荷は帰納的推論に匹敵し、任意の基本トレーニングの上で使用できます。エピソードトレーニングを行わず、基本クラスで標準のクロスエントロピートレーニングのみを使用することで、私たちの推論は、ワンショットシナリオの標準ベンチマークで競争力のあるパフォーマンスを生み出します。利用可能なショットの数が増えると、パフォーマンスのギャップが広がります。PASCAL-5iでは、この方法により、5ショットと10ショットのシナリオで、最先端技術に比べてそれぞれ約5%と6%の改善がもたらされます。 。さらに、ドメインシフトを含む新しい設定を導入します。この設定では、基本クラスと新規クラスが異なるデータセットから抽出されます。私たちの方法は、このより現実的な設定で最高のパフォーマンスを実現します。私たちのコードはオンラインで無料で入手できます:。
We show that the way inference is performed in few-shot segmentation tasks has a substantial effect on performances -- an aspect often overlooked in the literature in favor of the meta-learning paradigm. We introduce a transductive inference for a given query image, leveraging the statistics of its unlabeled pixels, by optimizing a new loss containing three complementary terms: i) the cross-entropy on the labeled support pixels; ii) the Shannon entropy of the posteriors on the unlabeled query-image pixels; and iii) a global KL-divergence regularizer based on the proportion of the predicted foreground. As our inference uses a simple linear classifier of the extracted features, its computational load is comparable to inductive inference and can be used on top of any base training. Foregoing episodic training and using only standard cross-entropy training on the base classes, our inference yields competitive performances on standard benchmarks in the 1-shot scenarios. As the number of available shots increases, the gap in performances widens: on PASCAL-5i, our method brings about 5% and 6% improvements over the state-of-the-art, in the 5- and 10-shot scenarios, respectively. Furthermore, we introduce a new setting that includes domain shifts, where the base and novel classes are drawn from different datasets. Our method achieves the best performances in this more realistic setting. Our code is freely available online:
updated: Mon Mar 29 2021 21:03:58 GMT+0000 (UTC)
published: Fri Dec 11 2020 07:11:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト