arXiv reaDer
直交性によるSVDメタ層の共分散条件付けの改善
Improving Covariance Conditioning of the SVD Meta-layer by Orthogonality
SVDメタレイヤーをニューラルネットワークに挿入すると、共分散が悪条件になる傾向があり、トレーニングの安定性と一般化能力のモデルに悪影響を与える可能性があります。この論文では、Pre-SVD層に直交性を適用することにより、共分散条件付けを改善する方法を体系的に研究します。重みに対する既存の直交処理が最初に調査されます。ただし、これらの手法はコンディショニングを改善できますが、パフォーマンスを低下させる可能性があります。このような副作用を回避するために、Nearest Orthogonal Gradient(NOG)とOptimal Learning Rate(OLR)を提案します。私たちの方法の有効性は、非相関バッチ正規化(BN)とグローバル共分散プーリング(GCP)の2つのアプリケーションで検証されています。視覚認識に関する広範な実験は、私たちの方法が共分散条件付けと一般化を同時に改善できることを示しています。さらに、直交ウェイトとの組み合わせにより、パフォーマンスをさらに向上させることができます。
Inserting an SVD meta-layer into neural networks is prone to make the covariance ill-conditioned, which could harm the model in the training stability and generalization abilities. In this paper, we systematically study how to improve the covariance conditioning by enforcing orthogonality to the Pre-SVD layer. Existing orthogonal treatments on the weights are first investigated. However, these techniques can improve the conditioning but would hurt the performance. To avoid such a side effect, we propose the Nearest Orthogonal Gradient (NOG) and Optimal Learning Rate (OLR). The effectiveness of our methods is validated in two applications: decorrelated Batch Normalization (BN) and Global Covariance Pooling (GCP). Extensive experiments on visual recognition demonstrate that our methods can simultaneously improve the covariance conditioning and generalization. Moreover, the combinations with orthogonal weight can further boost the performances.
updated: Tue Jul 05 2022 15:39:29 GMT+0000 (UTC)
published: Tue Jul 05 2022 15:39:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト