arXiv reaDer
スケッチとランダム特徴によるニューラルタンジェントカーネルのスケーリング
Scaling Neural Tangent Kernels via Sketching and Random Features
ニューラルタンジェントカーネル(NTK)は、勾配降下法による最小二乗損失の下でトレーニングされた無限幅のニューラルネットワークの動作を特徴づけます。最近の研究では、NTK回帰が小規模データセットでトレーニングされた有限幅のニューラルネットワークよりも優れている可能性があることも報告されています。ただし、カーネル法の計算の複雑さにより、大規模な学習タスクでの使用が制限されています。 NTKでの学習を加速するために、アークコサインカーネルの多項式展開をスケッチすることにより、NTKの入力スパースに近い時間近似アルゴリズムを設計します。NTKの畳み込み対応物(CNTK)のスケッチは、線形ランタイムを使用して任意の画像を変換できます。ピクセル数。さらに、アークコサインカーネルのランダムな特徴(レバレッジスコアサンプリングに基づく)をスケッチアルゴリズムと組み合わせることにより、NTK行列のスペクトル近似の保証を証明します。さまざまな大規模な回帰および分類タスクでメソッドのベンチマークを行い、CNTK機能でトレーニングされた線形回帰分析がCIFAR-10データセットの正確なCNTKの精度と一致し、150倍の速度向上を達成することを示します。
The Neural Tangent Kernel (NTK) characterizes the behavior of infinitely-wide neural networks trained under least squares loss by gradient descent. Recent works also report that NTK regression can outperform finitely-wide neural networks trained on small-scale datasets. However, the computational complexity of kernel methods has limited its use in large-scale learning tasks. To accelerate learning with NTK, we design a near input-sparsity time approximation algorithm for NTK, by sketching the polynomial expansions of arc-cosine kernels: our sketch for the convolutional counterpart of NTK (CNTK) can transform any image using a linear runtime in the number of pixels. Furthermore, we prove a spectral approximation guarantee for the NTK matrix, by combining random features (based on leverage score sampling) of the arc-cosine kernels with a sketching algorithm. We benchmark our methods on various large-scale regression and classification tasks and show that a linear regressor trained on our CNTK features matches the accuracy of exact CNTK on CIFAR-10 dataset while achieving 150x speedup.
updated: Wed Dec 08 2021 13:00:58 GMT+0000 (UTC)
published: Tue Jun 15 2021 04:44:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト