セマンティックセグメンテーションは目覚しい進歩を遂げましたが、複雑なシーンやオブジェクトのオクルージョンなどにより、依然として挑戦的です。深さマップは補足的な幾何学的キューを提供できるため、RGBベースのセマンティックセグメンテーションを支援するために深さマップなどの追加情報を使用しようとする研究がいくつかあります。ただし、深度センサーにアクセスできないため、通常、テスト画像の深度情報は利用できません。このホワイトペーパーでは、セマンティックセグメンテーションでハードピクセルをマイニングする特権情報としてトレーニング画像の深さのみを活用します。セマンティックセグメンテーションでは、深さ情報はトレーニング画像でのみ使用でき、テスト画像では使用できません。具体的には、ハードピクセルの2つの深度に関連する測定を使用して損失重みマップを出力する、新しい損失重みモジュールを提案します。深度予測エラーと深度認識セグメンテーションエラーです。次に、ハードピクセルにさらに注意を払うことで、より堅牢なモデルを学習することを目的として、損失重みマップをセグメンテーション損失に適用します。また、損失ウェイトマップに基づいたカリキュラム学習戦略も検討します。一方、さまざまなスケールでハードピクセルを完全にマイニングするために、ロスウェイトモジュールをマルチスケールのサイド出力に適用します。ハードピクセルマイニング手法は、2つのベンチマークデータセットで最先端の結果を達成し、テスト中に深度入力を必要とする手法よりも優れています。
Semantic segmentation has achieved remarkable progress but remains challenging due to the complex scene, object occlusion, and so on. Some research works have attempted to use extra information such as a depth map to help RGB based semantic segmentation because the depth map could provide complementary geometric cues. However, due to the inaccessibility of depth sensors, depth information is usually unavailable for the test images. In this paper, we leverage only the depth of training images as the privileged information to mine the hard pixels in semantic segmentation, in which depth information is only available for training images but not available for test images. Specifically, we propose a novel Loss Weight Module, which outputs a loss weight map by employing two depth-related measurements of hard pixels: Depth Prediction Error and Depthaware Segmentation Error. The loss weight map is then applied to segmentation loss, with the goal of learning a more robust model by paying more attention to the hard pixels. Besides, we also explore a curriculum learning strategy based on the loss weight map. Meanwhile, to fully mine the hard pixels on different scales, we apply our loss weight module to multi-scale side outputs. Our hard pixels mining method achieves the state-of-the-art results on two benchmark datasets, and even outperforms the methods which need depth input during testing.