arXiv reaDer
最小の超球エネルギーに向けた学習
Learning towards Minimum Hyperspherical Energy
ニューラルネットワークは、さまざまなアプリケーションでエンドツーエンドでトレーニングできる非線形関数の強力なクラスです。多くのニューラルネットワークの過剰パラメーター化の性質は、複雑な関数に適合させる能力と、困難なタスクを処理する強力な表現力を提供しますが、汎化能力を損ない、不必要な計算コストが発生する可能性のある高度に相関するニューロンにもつながります。その結果、望ましくない表現の冗長性を回避するためにネットワークを正規化する方法が重要な問題になります。この目的のために、物理学でよく知られている問題、つまりトムソン問題からヒントを得ています。トムソン問題では、最小ポテンシャルエネルギーで単位球上にN個の電子をできるだけ均一に分布させる状態を見つけようとしています。この直感に照らして、冗長正則化問題を一般的なエネルギー最小化に削減し、ニューラルネットワークの一般的な正則化として最小超球エネルギー(MHE)目標を提案します。また、MHEのいくつかの新しいバリアントを提案し、理論的な観点からいくつかの洞察を提供します。最後に、MHE正則化を使用したニューラルネットワークをいくつかの困難なタスクに適用します。広範な実験は、MHE正則化で優れたパフォーマンスを示すことにより、直観の有効性を実証します。
Neural networks are a powerful class of nonlinear functions that can be trained end-to-end on various applications. While the over-parametrization nature in many neural networks renders the ability to fit complex functions and the strong representation power to handle challenging tasks, it also leads to highly correlated neurons that can hurt the generalization ability and incur unnecessary computation cost. As a result, how to regularize the network to avoid undesired representation redundancy becomes an important issue. To this end, we draw inspiration from a well-known problem in physics -- Thomson problem, where one seeks to find a state that distributes N electrons on a unit sphere as evenly as possible with minimum potential energy. In light of this intuition, we reduce the redundancy regularization problem to generic energy minimization, and propose a minimum hyperspherical energy (MHE) objective as generic regularization for neural networks. We also propose a few novel variants of MHE, and provide some insights from a theoretical point of view. Finally, we apply neural networks with MHE regularization to several challenging tasks. Extensive experiments demonstrate the effectiveness of our intuition, by showing the superior performance with MHE regularization.
updated: Wed Jul 22 2020 15:23:29 GMT+0000 (UTC)
published: Wed May 23 2018 17:34:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト