arXiv reaDer
畳み込みニューラルネットワークにおける訓練可能なスペクトル初期化可能マトリックス変換
Trainable Spectrally Initializable Matrix Transformations in Convolutional Neural Networks
 この作業では、畳み込み演算によって生成された特徴マップ上で、トレーニング可能でスペクトル的に初期化可能なマトリックス変換の適用を調査します。過去の文献では、特徴的なプロセッサーとして静的スペクトル変換を追加する可能性がすでに実証されていますが、私たちの焦点はより一般的な訓練可能な変換です。医療(ColorectalHist、HAM10000)および自然(Flowers、ImageNet)の画像から歴史的文書(CB55)および手書き認識(GPDS)への4つの異なる性質のデータセットで、さまざまなアーキテクチャ構成の変換を研究します。パラメーターの数とランダム性を制御する厳密な実験により、導入されたマトリックス変換を利用するネットワークがバニラニューラルネットワークよりも優れていることを示します。観測された精度は、すべてのデータセットで平均2.2増加します。さらに、ランダムに初期化されたマトリックス変換とは対照的に、スペクトルの初期化の利点により、収束が大幅に高速化されることを示します。変換は、任意のニューラルネットワークアーキテクチャに組み込むことができる自動微分可能なPyTorchモジュールとして実装されます。コードベース全体がオープンソースです。
In this work, we investigate the application of trainable and spectrally initializable matrix transformations on the feature maps produced by convolution operations. While previous literature has already demonstrated the possibility of adding static spectral transformations as feature processors, our focus is on more general trainable transforms. We study the transforms in various architectural configurations on four datasets of different nature: from medical (ColorectalHist, HAM10000) and natural (Flowers, ImageNet) images to historical documents (CB55) and handwriting recognition (GPDS). With rigorous experiments that control for the number of parameters and randomness, we show that networks utilizing the introduced matrix transformations outperform vanilla neural networks. The observed accuracy increases by an average of 2.2 across all datasets. In addition, we show that the benefit of spectral initialization leads to significantly faster convergence, as opposed to randomly initialized matrix transformations. The transformations are implemented as auto-differentiable PyTorch modules that can be incorporated into any neural network architecture. The entire code base is open-source.
updated: Wed Nov 13 2019 17:36:08 GMT+0000 (UTC)
published: Tue Nov 12 2019 18:06:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト