arXiv reaDer
RKHS の演算子を使用したセマンティック セグメンテーションのモデルの不確実性の定量化
Quantifying Model Uncertainty for Semantic Segmentation using Operators in the RKHS
セマンティック セグメンテーションのディープ ラーニング モデルは、タスクの難易度が非常に高いため、実際のアプリケーションではパフォーマンスが低下する傾向があります。モデルの不確実性の定量化 (UQ) は、モデルの信頼性の欠如というこの問題に対処する 1 つの方法であり、実行者がセグメンテーションの出力をどれだけ信頼できるかを知ることができます。このアプリケーション ドメインでの現在の UQ メソッドは、主にベイジアン ベースのメソッドに制限されています。これは、計算コストが高く、不確実性の中心的な瞬間しか抽出できないため、不確実性推定の品質が制限されます。セマンティック セグメンテーション モデルの高解像度予測不確実性定量化のための単純なフレームワークを提示します。このフレームワークは、再生カーネル ヒルベルト空間 (RKHS) におけるモデルの特徴空間に関連付けられた不確実性のマルチモーメント関数定義を活用します。このフレームワークから抽出された複数の不確実性汎関数は、モデルの特徴空間の局所密度ダイナミクスによって定義されるため、特徴空間の固有確率密度関数のテール領域 (不確実性が最も高い場所) に自動的に整列します。連続して高次のモーメントがより不確実な領域を定量化する方法。これにより、モデルの不確実性が従来のベイズ法よりもはるかに正確に表示されます。さらに、そのような瞬間の抽出はシングルショット計算で行われるため、ベイジアンおよびアンサンブル アプローチ (不確実性を定量化するためにモデルの多数の前方確率的パスを含む) よりもはるかに高速になります。これらの利点を、2 つのベンチマーク道路シーン セグメンテーション データセット (Camvid と Cityscapes) でトレーニングおよび評価される 4 つの異なる最先端のモデル アーキテクチャに実装されたフレームワークの実験的評価を通じて実証します。
Deep learning models for semantic segmentation are prone to poor performance in real-world applications due to the highly challenging nature of the task. Model uncertainty quantification (UQ) is one way to address this issue of lack of model trustworthiness by enabling the practitioner to know how much to trust a segmentation output. Current UQ methods in this application domain are mainly restricted to Bayesian based methods which are computationally expensive and are only able to extract central moments of uncertainty thereby limiting the quality of their uncertainty estimates. We present a simple framework for high-resolution predictive uncertainty quantification of semantic segmentation models that leverages a multi-moment functional definition of uncertainty associated with the model's feature space in the reproducing kernel Hilbert space (RKHS). The multiple uncertainty functionals extracted from this framework are defined by the local density dynamics of the model's feature space and hence automatically align themselves at the tail-regions of the intrinsic probability density function of the feature space (where uncertainty is the highest) in such a way that the successively higher order moments quantify the more uncertain regions. This leads to a significantly more accurate view of model uncertainty than conventional Bayesian methods. Moreover, the extraction of such moments is done in a single-shot computation making it much faster than Bayesian and ensemble approaches (that involve a high number of forward stochastic passes of the model to quantify its uncertainty). We demonstrate these advantages through experimental evaluations of our framework implemented over four different state-of-the-art model architectures that are trained and evaluated on two benchmark road-scene segmentation datasets (Camvid and Cityscapes).
updated: Thu Nov 03 2022 17:10:49 GMT+0000 (UTC)
published: Thu Nov 03 2022 17:10:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト