arXiv reaDer
安定性のためのVAEの再パラメータ化
Re-parameterizing VAEs for stability
変分オートエンコーダ(VAE)の数値安定性のトレーニングに向けた理論的アプローチを提案します。私たちの仕事は、VAEが複雑な画像データセットで最先端の生成結果に到達できるようにする最近の研究によって動機付けられています。これらの非常に深いVAEアーキテクチャ、およびより複雑な出力分布を使用するVAEは、NaN損失だけでなく高いトレーニング勾配を無計画に生成する傾向を浮き彫りにします。それらの制限にもかかわらずそれらを訓練するために提案された経験的修正は、完全に理論的に根拠がなく、実際には一般的に十分でもありません。これに基づいて、モデルのニューラルネットワークとそれらの出力確率分布の間のインターフェイスで問題の原因を特定します。エンコードされた正規分布の分散の不注意な定式化に起因する不安定性の一般的な原因を説明し、他のあまり明白でない原因に同じアプローチを適用します。依存する正規分布をパラメーター化する方法に小さな変更を実装することで、VAEを安全にトレーニングできることを示します。
We propose a theoretical approach towards the training numerical stability of Variational AutoEncoders (VAE). Our work is motivated by recent studies empowering VAEs to reach state of the art generative results on complex image datasets. These very deep VAE architectures, as well as VAEs using more complex output distributions, highlight a tendency to haphazardly produce high training gradients as well as NaN losses. The empirical fixes proposed to train them despite their limitations are neither fully theoretically grounded nor generally sufficient in practice. Building on this, we localize the source of the problem at the interface between the model's neural networks and their output probabilistic distributions. We explain a common source of instability stemming from an incautious formulation of the encoded Normal distribution's variance, and apply the same approach on other, less obvious sources. We show that by implementing small changes to the way we parameterize the Normal distributions on which they rely, VAEs can securely be trained.
updated: Fri Jun 25 2021 16:19:09 GMT+0000 (UTC)
published: Fri Jun 25 2021 16:19:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト