arXiv reaDer
現代のニューラルネットワークのキャリブレーションの再考
Revisiting the Calibration of Modern Neural Networks
ニューラルネットワークを安全に適用するには、予測の不確実性の正確な推定(モデルのキャリブレーション)が不可欠です。最新のニューラルネットワークでのキャリブレーションミスの多くの事例が報告されており、より新しい、より正確なモデルが不十分にキャリブレーションされた予測を生成する傾向を示唆しています。ここでは、最近の最先端の画像分類モデルについて、この質問を再検討します。モデルのキャリブレーションと精度を体系的に関連付け、最新のモデル、特に畳み込みを使用していないモデルが最もよくキャリブレーションされていることを確認します。分布シフトやモデルサイズによるキャリブレーションの減衰など、以前のモデル世代で観察された傾向は、最近のアーキテクチャではそれほど顕著ではありません。また、モデルのサイズと事前トレーニングの量がこれらの違いを完全に説明していないことも示しています。これは、アーキテクチャがキャリブレーションプロパティの主要な決定要因であることを示唆しています。
Accurate estimation of predictive uncertainty (model calibration) is essential for the safe application of neural networks. Many instances of miscalibration in modern neural networks have been reported, suggesting a trend that newer, more accurate models produce poorly calibrated predictions. Here, we revisit this question for recent state-of-the-art image classification models. We systematically relate model calibration and accuracy, and find that the most recent models, notably those not using convolutions, are among the best calibrated. Trends observed in prior model generations, such as decay of calibration with distribution shift or model size, are less pronounced in recent architectures. We also show that model size and amount of pretraining do not fully explain these differences, suggesting that architecture is a major determinant of calibration properties.
updated: Tue Jun 15 2021 09:24:43 GMT+0000 (UTC)
published: Tue Jun 15 2021 09:24:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト