arXiv reaDer
確率的表現による半教師付きセマンティック セグメンテーションのブースト
Boosting Semi-Supervised Semantic Segmentation with Probabilistic Representations
半教師付きセマンティック セグメンテーションにおける最近のブレークスルーは、対照学習によって開発されました。一般的なピクセル単位の対照学習ソリューションでは、モデルはピクセルを決定論的表現にマッピングし、潜在空間でそれらを正則化します。ただし、モデルの認識能力が限られているため、ピクセルのあいまいな表現を間違ったクラスにマッピングする、不正確な疑似ラベルが存在します。この論文では、確率論の新しい観点からピクセル単位の表現を定義し、その確率を考慮して表現品質を改善する確率的表現対照学習(PRCL)フレームワークを提案します。ピクセルから表現へのマッピングを多変量ガウス分布による確率としてモデル化することで、あいまいな表現の寄与を調整して、不正確な疑似ラベルのリスクを許容することができます。さらに、クラスの信頼度を示す分布の形でプロトタイプを定義しますが、ポイント プロトタイプでは定義できません。さらに、表現の信頼性を高めるために分布分散を正則化することを提案します。これらの利点を利用して、高品質の特徴表現を潜在空間で導出できるため、セマンティック セグメンテーションのパフォーマンスをさらに向上させることができます。 Pascal VOC と CityScapes で PRCL を評価するのに十分な実験を行います。最先端のアプローチとの比較は、提案された PRCL の優位性を示しています。
Recent breakthroughs in semi-supervised semantic segmentation have been developed through contrastive learning. In prevalent pixel-wise contrastive learning solutions, the model maps pixels to deterministic representations and regularizes them in the latent space. However, there exist inaccurate pseudo-labels which map the ambiguous representations of pixels to the wrong classes due to the limited cognitive ability of the model. In this paper, we define pixel-wise representations from a new perspective of probability theory and propose a Probabilistic Representation Contrastive Learning (PRCL) framework that improves representation quality by taking its probability into consideration. Through modeling the mapping from pixels to representations as the probability via multivariate Gaussian distributions, we can tune the contribution of the ambiguous representations to tolerate the risk of inaccurate pseudo-labels. Furthermore, we define prototypes in the form of distributions, which indicates the confidence of a class, while the point prototype cannot. Moreover, we propose to regularize the distribution variance to enhance the reliability of representations. Taking advantage of these benefits, high-quality feature representations can be derived in the latent space, thereby the performance of semantic segmentation can be further improved. We conduct sufficient experiment to evaluate PRCL on Pascal VOC and CityScapes. The comparisons with state-of-the-art approaches demonstrate the superiority of proposed PRCL.
updated: Sat Nov 12 2022 03:55:19 GMT+0000 (UTC)
published: Wed Oct 26 2022 12:47:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト