近年、ディープ ニューラル ネットワークはセマンティック セグメンテーションの最先端技術を定義しており、その予測は定義済みのセマンティック クラスのセットに制限されています。それらは、自動運転などのアプリケーションに展開されることになっていますが、その表現力はそのようなオープンワールドのシナリオに反して実行されます。したがって、定義済みのセマンティック スペースの外側からのオブジェクト、つまり、分散外 (OoD) オブジェクトの検出とセグメンテーションが最も重要です。ソフトマックス エントロピーやベイジアン モデルなどの不確実性推定方法は、誤った予測の影響を受けやすいため、これらの方法は OoD 検出の自然なベースラインとなります。ここでは、推論中に効率的に計算できるピクセル単位の損失勾配から不確実性スコアを取得する方法を紹介します。私たちのアプローチは、大規模なクラスのモデルに簡単に実装でき、追加のトレーニングや補助データを必要とせず、事前トレーニング済みのセグメンテーション モデルで簡単に使用できます。私たちの実験は、間違ったピクセル分類を識別し、予測品質を推定する方法の能力を示しています。特に、OoD セグメンテーションに関しては、SegmentMeIfYouCan ベンチマークの同等のベースラインよりも優れたパフォーマンスを示しており、同様に柔軟に実装できる方法よりも明らかに優れています。
In recent years, deep neural networks have defined the state-of-the-art in semantic segmentation where their predictions are constrained to a predefined set of semantic classes. They are to be deployed in applications such as automated driving, although their categorically confined expressive power runs contrary to such open world scenarios. Thus, the detection and segmentation of objects from outside their predefined semantic space, i.e., out-of-distribution (OoD) objects, is of highest interest. Since uncertainty estimation methods like softmax entropy or Bayesian models are sensitive to erroneous predictions, these methods are a natural baseline for OoD detection. Here, we present a method for obtaining uncertainty scores from pixel-wise loss gradients which can be computed efficiently during inference. Our approach is simple to implement for a large class of models, does not require any additional training or auxiliary data and can be readily used on pre-trained segmentation models. Our experiments show the ability of our method to identify wrong pixel classifications and to estimate prediction quality. In particular, we observe superior performance in terms of OoD segmentation to comparable baselines on the SegmentMeIfYouCan benchmark, clearly outperforming methods which are similarly flexible to implement.