畳み込みニューラルネットワーク(CNN)ベースのソリューションは、画像の分類や超解像など、多くのコンピュータービジョンタスクで最先端のパフォーマンスを実現しています。通常、これらの方法を成功させるには、深い畳み込み層を積み重ねるために何百万ものパラメーターが必要になります。さらに、非常に多くのフィルターが単一の畳み込み層にも使用され、現在の方法のパラメーター負担を誇張しています。したがって、このペーパーでは、畳み込み層のフィルターの基礎を学習することにより、CNNのパラメーターの数を減らします。フォワードパスでは、学習された基底を使用して元のフィルターを近似し、畳み込み層のパラメーターとして使用します。複数のCNNアーキテクチャの提案されたソリューションを画像分類と画像の超解像ベンチマークで検証し、パラメーターの削減と精度の保持の観点から既存の最先端技術と比較して有利です。
Convolutional neural networks (CNNs) based solutions have achieved state-of-the-art performances for many computer vision tasks, including classification and super-resolution of images. Usually the success of these methods comes with a cost of millions of parameters due to stacking deep convolutional layers. Moreover, quite a large number of filters are also used for a single convolutional layer, which exaggerates the parameter burden of current methods. Thus, in this paper, we try to reduce the number of parameters of CNNs by learning a basis of the filters in convolutional layers. For the forward pass, the learned basis is used to approximate the original filters and then used as parameters for the convolutional layers. We validate our proposed solution for multiple CNN architectures on image classification and image super-resolution benchmarks and compare favorably to the existing state-of-the-art in terms of reduction of parameters and preservation of accuracy.