このホワイトペーパーでは、トレーニング画像のごく一部のみがラベル付けされ、他の部分はラベル付けされていないことを前提とした、半教師あり学習のセマンティックセグメンテーションについて説明します。ラベルのない画像には通常、トレーニングで使用する疑似ラベルが割り当てられますが、疑似ラベルのエラーに対する確証バイアスのために、パフォーマンスが低下するリスクが生じることがよくあります。疑似ラベリングのこの慢性的な問題を解決する新しい方法を提示します。私たちの方法の中心は、エラーローカリゼーションネットワーク(ELN)です。これは、画像とそのセグメンテーション予測を入力として受け取り、疑似ラベルが間違っている可能性が高いピクセルを識別する補助モジュールです。 ELNは、トレーニング中のラベルノイズを無視することにより、半教師あり学習が不正確な疑似ラベルに対して堅牢になることを可能にし、自己トレーニングおよび対照学習と自然に統合できます。さらに、ELNの一般化を強化するために、ELNのトレーニング中にもっともらしい多様なセグメンテーションエラーをシミュレートするELNの新しい学習戦略を紹介します。私たちの方法は、PASCAL VOC 2012とCityscapesで評価され、すべての評価設定で既存のすべての方法よりも優れています。
This paper studies semi-supervised learning of semantic segmentation, which assumes that only a small portion of training images are labeled and the others remain unlabeled. The unlabeled images are usually assigned pseudo labels to be used in training, which however often causes the risk of performance degradation due to the confirmation bias towards errors on the pseudo labels. We present a novel method that resolves this chronic issue of pseudo labeling. At the heart of our method lies error localization network (ELN), an auxiliary module that takes an image and its segmentation prediction as input and identifies pixels whose pseudo labels are likely to be wrong. ELN enables semi-supervised learning to be robust against inaccurate pseudo labels by disregarding label noises during training and can be naturally integrated with self-training and contrastive learning. Moreover, we introduce a new learning strategy for ELN that simulates plausible and diverse segmentation errors during training of ELN to enhance its generalization. Our method is evaluated on PASCAL VOC 2012 and Cityscapes, where it outperforms all existing methods in every evaluation setting.