arXiv reaDer
機械学習の残余行列積状態
Residual Matrix Product State for Machine Learning
量子物理学に由来するテンソルネットワーク(TN)は、古典的および量子機械学習(ML)で幅広い展望を示しています。ただし、TNと古典的なMLの高度なニューラルネットワーク(NN)モデルの間には、依然としてかなりの精度のギャップがあります。たとえば、NNから技術を借りることによって、TNMLをどこまで改善できるかはまだわかりません。この作業では、行列積状態(MPS)と残余NNのアイデアを組み合わせることにより、残余行列積状態(ResMPS)を提案します。 ResMPSは、そのレイヤーが「非表示」の特徴を出力(分類など)にマッピングするネットワークとして扱うことができ、レイヤーの変分パラメーターはサンプルの特徴(画像のピクセルなど)の関数です。これは、レイヤーがフィーチャをフィードフォワードで出力にマッピングするNNとは本質的に異なります。 ResMPSは、非線形のアクティベーションレイヤーとドロップアウトレイヤーを自然に組み込むことができ、効率、安定性、および発現力に関して最先端のTNモデルよりも優れています。さらに、ResMPSは、因数分解と指数関数が自然に出現する多項式展開の観点から解釈できます。私たちの仕事は、神経ネットワークとテンソルネットワークの接続とハイブリッド化に貢献します。これは、動作メカニズムをさらに理解し、両方のモデルのパフォーマンスを向上させるために重要です。
Tensor network (TN), which originates from quantum physics, shows broad prospects in classical and quantum machine learning (ML). However, there still exists a considerable gap of accuracy between TN and the sophisticated neural network (NN) models for classical ML. It is still elusive how far TN ML can be improved by, e.g., borrowing the techniques from NN. In this work, we propose the residual matrix product state (ResMPS) by combining the ideas of matrix product state (MPS) and residual NN. ResMPS can be treated as a network where its layers map the "hidden" features to the outputs (e.g., classifications), and the variational parameters of the layers are the functions of the features of samples (e.g., pixels of images). This is essentially different from NN, where the layers map feed-forwardly the features to the output. ResMPS can naturally incorporate with the non-linear activations and dropout layers, and outperforms the state-of-the-art TN models on the efficiency, stability, and expression power. Besides, ResMPS is interpretable from the perspective of polynomial expansion, where the factorization and exponential machines naturally emerge. Our work contributes to connecting and hybridizing neural and tensor networks, which is crucial to understand the working mechanisms further and improve both models' performances.
updated: Tue Dec 22 2020 05:44:20 GMT+0000 (UTC)
published: Tue Dec 22 2020 05:44:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト