arXiv reaDer
密な不確実性の推定
Dense Uncertainty Estimation
ディープニューラルネットワークは、決定論的ニューラルネットワークと確率的ニューラルネットワークに大別できます。前者は通常、重みの最尤推定を介して入力空間から出力空間へのマッピングを実現するようにトレーニングされており、テスト中の決定論的予測につながります。このようにして、適切な重み空間で発生する可能性のある不確実性を無視して、特定の重みセットが推定されます。後者は、モデルパラメータ(つまりベイジアンニューラルネットワーク)の事前分布を仮定するか、潜在変数(つまり生成モデル)を含めてモデル予測に対する潜在変数の寄与を調査することにより、フレームワークにランダム性を導入し、テスト中の確率的予測につながります。後者は、点推定を実現する前者とは異なり、予測分布を推定することを目的としており、予測に関するモデルの無知を表す不確実性の推定を可能にします。従来の決定論的ニューラルネットワークベースの密な予測タスクは過剰適合しがちであり、自信過剰な予測につながると主張します。これは意思決定には望ましくありません。この論文では、確率的ニューラルネットワークと不確実性推定手法を調査して、正確な決定論的予測と信頼性の高い不確実性推定の両方を実現します。具体的には、アンサンブルベースの方法と生成モデルベースの方法の2種類の不確実性推定ソリューションに取り組み、完全/半/弱教師ありフレームワークで使用しながら、それらの長所と短所を説明します。不確実性の推定とモデルのキャリブレーションは密接に関連しているため、詳細なモデルのキャリブレーションに不確実性の推定を使用して、適切にキャリブレーションされたモデル、つまり高密度モデルのキャリブレーションを実現する方法についても紹介します。コードとデータはhttps://github.com/JingZhang617/UncertaintyEstimationで入手できます。
Deep neural networks can be roughly divided into deterministic neural networks and stochastic neural networks.The former is usually trained to achieve a mapping from input space to output space via maximum likelihood estimation for the weights, which leads to deterministic predictions during testing. In this way, a specific weights set is estimated while ignoring any uncertainty that may occur in the proper weight space. The latter introduces randomness into the framework, either by assuming a prior distribution over model parameters (i.e. Bayesian Neural Networks) or including latent variables (i.e. generative models) to explore the contribution of latent variables for model predictions, leading to stochastic predictions during testing. Different from the former that achieves point estimation, the latter aims to estimate the prediction distribution, making it possible to estimate uncertainty, representing model ignorance about its predictions. We claim that conventional deterministic neural network based dense prediction tasks are prone to overfitting, leading to over-confident predictions, which is undesirable for decision making. In this paper, we investigate stochastic neural networks and uncertainty estimation techniques to achieve both accurate deterministic prediction and reliable uncertainty estimation. Specifically, we work on two types of uncertainty estimations solutions, namely ensemble based methods and generative model based methods, and explain their pros and cons while using them in fully/semi/weakly-supervised framework. Due to the close connection between uncertainty estimation and model calibration, we also introduce how uncertainty estimation can be used for deep model calibration to achieve well-calibrated models, namely dense model calibration. Code and data are available at https://github.com/JingZhang617/UncertaintyEstimation.
updated: Wed Oct 13 2021 01:23:48 GMT+0000 (UTC)
published: Wed Oct 13 2021 01:23:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト