arXiv reaDer
近似行列の平方根がグローバル共分散プーリングで正確なSVDよりも優れているのはなぜですか?
Why Approximate Matrix Square Root Outperforms Accurate SVD in Global Covariance Pooling?
グローバル共分散プーリング(GCP)は、畳み込み特徴の2次統計を活用することを目的としています。その有効性は、畳み込みニューラルネットワーク(CNN)の分類パフォーマンスを向上させることで実証されています。特異値分解(SVD)は、行列の平方根を計算するためにGCPで使用されます。ただし、Newton-Schulz反復li2018towardsを使用して計算された近似行列の平方根は、SVDli2017secondを介して計算された正確な行列の平方根よりも優れています。データの精度と勾配の滑らかさの観点から、パフォーマンスギャップの背後にある理由を経験的に分析します。滑らかなSVD勾配を計算するためのさまざまな救済策が調査されています。私たちの観察と分析に基づいて、ニュートン-シュルツの反復に対して競争力のあるパフォーマンスを達成できるように、SVDベースのGCPメタレイヤーに対してハイブリッドトレーニングプロトコルが提案されています。さらに、フォワードパスでSVDを使用し、バックワード伝播でパデ近似を使用して勾配を計算する新しいGCPメタレイヤーを提案します。提案されたメタレイヤーは、さまざまなCNNモデルに統合されており、大規模なデータセットときめ細かいデータセットの両方で最先端のパフォーマンスを実現します。
Global covariance pooling (GCP) aims at exploiting the second-order statistics of the convolutional feature. Its effectiveness has been demonstrated in boosting the classification performance of Convolutional Neural Networks (CNNs). Singular Value Decomposition (SVD) is used in GCP to compute the matrix square root. However, the approximate matrix square root calculated using Newton-Schulz iteration li2018towards outperforms the accurate one computed via SVD li2017second. We empirically analyze the reason behind the performance gap from the perspectives of data precision and gradient smoothness. Various remedies for computing smooth SVD gradients are investigated. Based on our observation and analyses, a hybrid training protocol is proposed for SVD-based GCP meta-layers such that competitive performances can be achieved against Newton-Schulz iteration. Moreover, we propose a new GCP meta-layer that uses SVD in the forward pass, and Padé Approximants in the backward propagation to compute the gradients. The proposed meta-layer has been integrated into different CNN models and achieves state-of-the-art performances on both large-scale and fine-grained datasets.
updated: Thu May 06 2021 08:03:45 GMT+0000 (UTC)
published: Thu May 06 2021 08:03:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト