arXiv reaDer
展開された高速道路の期待値の最大化による勾配流の改善
Improving Gradient Flow with Unrolled Highway Expectation Maximization
モデルベースの機械学習手法をディープニューラルアーキテクチャに統合することで、ディープニューラルネットの表現力と、ドメイン固有の知識を組み込むモデルベースの手法の能力の両方を活用できます。特に、多くの研究では、バックボーンニューラルネットワークと共同でトレーニングされた展開されたレイヤーワイズ構造の形で期待値最大化(EM)アルゴリズムが採用されています。ただし、勾配消失問題が発生しやすいため、EM反復を逆伝播してバックボーンネットワークを識別的にトレーニングすることは困難です。この問題に対処するために、ニュートン-ラープソン法に基づく一般化EM(GEM)アルゴリズムの展開された反復で構成される高速道路期待値最大化ネットワーク(HEMNet)を提案します。 HEMNetは、展開されたアーキテクチャの深さに沿ってスケーリングされたスキップ接続または高速道路を備えているため、標準の展開されたEMと比較して、追加の計算とメモリのコストはごくわずかですが、バックプロパゲーション中の勾配フローが改善されます。さらに、HEMNetは基礎となるEMプロシージャを保持するため、元のEMアルゴリズムの収束プロパティを完全に保持します。いくつかのセマンティックセグメンテーションベンチマークでパフォーマンスの大幅な向上を達成し、HEMNetが勾配減衰を効果的に軽減することを経験的に示しています。
Integrating model-based machine learning methods into deep neural architectures allows one to leverage both the expressive power of deep neural nets and the ability of model-based methods to incorporate domain-specific knowledge. In particular, many works have employed the expectation maximization (EM) algorithm in the form of an unrolled layer-wise structure that is jointly trained with a backbone neural network. However, it is difficult to discriminatively train the backbone network by backpropagating through the EM iterations as they are prone to the vanishing gradient problem. To address this issue, we propose Highway Expectation Maximization Networks (HEMNet), which is comprised of unrolled iterations of the generalized EM (GEM) algorithm based on the Newton-Rahpson method. HEMNet features scaled skip connections, or highways, along the depths of the unrolled architecture, resulting in improved gradient flow during backpropagation while incurring negligible additional computation and memory costs compared to standard unrolled EM. Furthermore, HEMNet preserves the underlying EM procedure, thereby fully retaining the convergence properties of the original EM algorithm. We achieve significant improvement in performance on several semantic segmentation benchmarks and empirically show that HEMNet effectively alleviates gradient decay.
updated: Wed Dec 09 2020 09:11:45 GMT+0000 (UTC)
published: Wed Dec 09 2020 09:11:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト