ベイズニューラルネットワーク(BNN)は、不確実性の推定と堅牢性の分野で成功を収めています。ただし、重大な課題により、実際の使用は禁止されています。ベイジアンNNは、信頼できる結果を生成するために多数の予測を必要とし、計算コストの大幅な増加につながります。この問題を軽減するために、CNNの隣接する特徴マップポイントをアンサンブルする方法である空間平滑化を提案します。モデルにいくつかのブラーレイヤーを追加するだけで、空間平滑化により、アンサンブルサイズの全範囲にわたってBNNの精度、不確実性の推定、および堅牢性が向上することを経験的に示します。特に、空間平滑化を組み込んだBNNは、ほんの一握りのアンサンブルで高い予測パフォーマンスを実現します。さらに、この方法は、パフォーマンスを向上させるために、標準的な決定論的ニューラルネットワークにも適用できます。多くの証拠は、改善が損失状況の平滑化と平坦化に起因する可能性があることを示唆しています。さらに、空間平滑化の特殊なケースとしてそれらに対処することにより、以前の作業、つまりグローバル平均プーリング、事前アクティブ化、およびReLU6の基本的な説明を提供します。これらは、精度を向上させるだけでなく、空間平滑化と同じ方法で損失ランドスケープを滑らかにすることにより、不確実性の推定とロバスト性を向上させます。コードはhttps://github.com/xxxnell/spatial-smoothingで入手できます。
Bayesian neural networks (BNNs) have shown success in the areas of uncertainty estimation and robustness. However, a crucial challenge prohibits their use in practice: Bayesian NNs require a large number of predictions to produce reliable results, leading to a significant increase in computational cost. To alleviate this issue, we propose spatial smoothing, a method that ensembles neighboring feature map points of CNNs. By simply adding a few blur layers to the models, we empirically show that the spatial smoothing improves accuracy, uncertainty estimation, and robustness of BNNs across a whole range of ensemble sizes. In particular, BNNs incorporating the spatial smoothing achieve high predictive performance merely with a handful of ensembles. Moreover, this method also can be applied to canonical deterministic neural networks to improve the performances. A number of evidences suggest that the improvements can be attributed to the smoothing and flattening of the loss landscape. In addition, we provide a fundamental explanation for prior works - namely, global average pooling, pre-activation, and ReLU6 - by addressing to them as special cases of the spatial smoothing. These not only enhance accuracy, but also improve uncertainty estimation and robustness by making the loss landscape smoother in the same manner as the spatial smoothing. The code is available at https://github.com/xxxnell/spatial-smoothing.