ニューラルネットワークの予測の信頼性は、多くのアプリケーションで重要です。具体的には、がんの予測や自動運転などの安全性が重要な領域では、モデルの予測の信頼性が結果の解釈にとって重要です。最新のディープニューラルネットワークは、さまざまな画像分類タスクのパフォーマンスを大幅に向上させました。ただし、これらのネットワークは、出力の信頼性に関して不十分に調整される傾向があります。温度スケーリングは、効率的な後処理ベースの較正スキームであり、十分に較正された結果を取得します。この研究では、温度スケーリングの概念を活用して、洗練されたビンごとのスケーリングを構築します。さらに、精巧なスケーリングのために検証サンプルの増強を採用しています。提案された方法は、さまざまなデータセットと深い畳み込みニューラルネットワークモデルで一貫してキャリブレーションパフォーマンスを向上させます。
The prediction reliability of neural networks is important in many applications. Specifically, in safety-critical domains, such as cancer prediction or autonomous driving, a reliable confidence of model's prediction is critical for the interpretation of the results. Modern deep neural networks have achieved a significant improvement in performance for many different image classification tasks. However, these networks tend to be poorly calibrated in terms of output confidence. Temperature scaling is an efficient post-processing-based calibration scheme and obtains well calibrated results. In this study, we leverage the concept of temperature scaling to build a sophisticated bin-wise scaling. Furthermore, we adopt augmentation of validation samples for elaborated scaling. The proposed methods consistently improve calibration performance with various datasets and deep convolutional neural network models.