arXiv reaDer
事後的に見る:ニューラルネットワーク分類における不確実性の起源について
Looking at the posterior: on the origin of uncertainty in neural-network classification
ベイジアン推論では、モデル パラメーターとネットワーク出力の事後分布を使用して、ニューラル ネットワークの予測における不確実性を定量化できます。これらの事後分布を見ることで、不確実性の起源を偶然性と認識論に分けることができます。予測の不確実性と認識の不確実性の共同分布を使用して、この不確実性の解釈がモデル アーキテクチャ、データセットの複雑さ、および画像分類タスクにおけるデータ分布のシフトにどのように依存するかを定量化します。不確実性の原因は各ニューラル ネットワークの主観的なものであり、データ分布のシフトから生じる不確実性の定量化は、基になるデータセットの複雑さに依存すると結論付けています。さらに、予測的不確実性と認識論的不確実性の同時分布を使用して、モデルが最も正確なデータ ドメインを特定できることを示します。これらの結果に到達するために、完全に接続された畳み込みおよび注意ベースのニューラル ネットワークに対して、モンテカルロ ドロップアウトとディープ アンサンブルという 2 つの一般的な事後近似法を使用します。
Bayesian inference can quantify uncertainty in the predictions of neural networks using posterior distributions for model parameters and network output. By looking at these posterior distributions, one can separate the origin of uncertainty into aleatoric and epistemic. We use the joint distribution of predictive uncertainty and epistemic uncertainty to quantify how this interpretation of uncertainty depends upon model architecture, dataset complexity, and data distributional shifts in image classification tasks. We conclude that the origin of uncertainty is subjective to each neural network and that the quantification of the induced uncertainty from data distributional shifts depends on the complexity of the underlying dataset. Furthermore, we show that the joint distribution of predictive and epistemic uncertainty can be used to identify data domains where the model is most accurate. To arrive at these results, we use two common posterior approximation methods, Monte-Carlo dropout and deep ensembles, for fully-connected, convolutional and attention-based neural networks.
updated: Sat Nov 26 2022 16:13:32 GMT+0000 (UTC)
published: Sat Nov 26 2022 16:13:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト