ニューラルネットワークの重みの事後検定は、高次元でマルチモーダルです。通常、各モードは、データの意味のある異なる表現を特徴付けます。このような分布を自動的に探索するために、循環確率勾配MCMC(SG-MCMC)を開発しています。特に、大きなステップが新しいモードを発見し、小さなステップが各モードを特徴付ける循環的なステップサイズのスケジュールを提案します。また、提案したアルゴリズムの非漸近的収束を証明します。さらに、ImageNetを含む広範な実験結果を提供して、特に最新のディープニューラルネットワークによる完全なベイジアン推論のために、複雑なマルチモーダル分布の学習における周期的なSG-MCMCのスケーラビリティと有効性を示します。
The posteriors over neural network weights are high dimensional and multimodal. Each mode typically characterizes a meaningfully different representation of the data. We develop Cyclical Stochastic Gradient MCMC (SG-MCMC) to automatically explore such distributions. In particular, we propose a cyclical stepsize schedule, where larger steps discover new modes, and smaller steps characterize each mode. We also prove non-asymptotic convergence of our proposed algorithm. Moreover, we provide extensive experimental results, including ImageNet, to demonstrate the scalability and effectiveness of cyclical SG-MCMC in learning complex multimodal distributions, especially for fully Bayesian inference with modern deep neural networks.