arXiv reaDer
球形モーションダイナミクス:正規化、重み減衰、およびSGDを使用したニューラルネットワークの学習ダイナミクス
Spherical Motion Dynamics: Learning Dynamics of Neural Network with Normalization, Weight Decay, and SGD
この作業では、Spherical Motion Dynamics(SMD)と呼ばれる、正規化、重み減衰(WD)、およびSGD(運動量を伴う)を使用したニューラルネットワークの学習ダイナミクスを包括的に明らかにします。ほとんどの関連する研究は、体重基準が変わらない「平衡」状態での「有効学習率」に焦点を当ててSMDを研究しています。ただし、SMDで平衡状態に到達できる理由に関する彼らの議論は、存在しないか、説得力がありません。私たちの仕事は、平衡状態の原因を直接調査することによってSMDを調査します。具体的には、1)SMDの平衡状態につながる可能性のある仮定を導入し、重みノルムが与えられた仮定で線形速度で収束できることを証明します。 2)SMDでニューラルネットワークの進化を測定するための有効学習率の代わりに「角度更新」を提案し、角度更新も線形速度で理論値に収束できることを証明します。 3)ImageNetやMSCOCOを含むさまざまなコンピュータービジョンタスクの仮定と理論的結果を標準設定で検証します。実験結果は、私たちの理論的発見が経験的観察とよく一致することを示しています。
In this work, we comprehensively reveal the learning dynamics of neural network with normalization, weight decay (WD), and SGD (with momentum), named as Spherical Motion Dynamics (SMD). Most related works study SMD by focusing on "effective learning rate" in "equilibrium" condition, where weight norm remains unchanged. However, their discussions on why equilibrium condition can be reached in SMD is either absent or less convincing. Our work investigates SMD by directly exploring the cause of equilibrium condition. Specifically, 1) we introduce the assumptions that can lead to equilibrium condition in SMD, and prove that weight norm can converge at linear rate with given assumptions; 2) we propose "angular update" as a substitute for effective learning rate to measure the evolving of neural network in SMD, and prove angular update can also converge to its theoretical value at linear rate; 3) we verify our assumptions and theoretical results on various computer vision tasks including ImageNet and MSCOCO with standard settings. Experiment results show our theoretical findings agree well with empirical observations.
updated: Fri Nov 27 2020 06:10:50 GMT+0000 (UTC)
published: Mon Jun 15 2020 14:16:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト