ディープ畳み込みニューラルネットワーク(DCNN)で、ヘビアン学習と最急降下法を組み合わせた半教師ありトレーニング戦略を使用して、サンプル効率の問題に対処することを提案します。すべての内部層(畳み込みおよび完全接続の両方)は、ヘビアン学習に基づく教師なしアプローチ、および最後の完全に接続された層(分類層)は、確率的勾配降下法(SGD)を使用してトレーニングされます。実際、ヘッブ学習は教師なし学習方法であるため、その可能性は、ラベルなしでDCNNの内部層をトレーニングする可能性にあります。最終的な完全に接続されたレイヤーのみを、ラベル付きの例でトレーニングする必要があります。さまざまなオブジェクト認識データセットで、サンプル効率のさまざまなレジームで実験を行い、半教師あり(内部層の場合はヘビアン+最終的な完全接続層の場合はSGD)アプローチを、エンドツーエンドの教師ありバックプロパゲーショントレーニングおよび半教師あり学習と比較しました。変分オートエンコーダー(VAE)に基づく教師あり学習。結果は、利用可能なラベル付きサンプルの数が少ないレジームでは、ほとんどすべての場合で、半教師ありアプローチが他のアプローチよりも優れていることを示しています。
We propose to address the issue of sample efficiency, in Deep Convolutional Neural Networks (DCNN), with a semi-supervised training strategy that combines Hebbian learning with gradient descent: all internal layers (both convolutional and fully connected) are pre-trained using an unsupervised approach based on Hebbian learning, and the last fully connected layer (the classification layer) is trained using Stochastic Gradient Descent (SGD). In fact, as Hebbian learning is an unsupervised learning method, its potential lies in the possibility of training the internal layers of a DCNN without labels. Only the final fully connected layer has to be trained with labeled examples. We performed experiments on various object recognition datasets, in different regimes of sample efficiency, comparing our semi-supervised (Hebbian for internal layers + SGD for the final fully connected layer) approach with end-to-end supervised backprop training, and with semi-supervised learning based on Variational Auto-Encoder (VAE). The results show that, in regimes where the number of available labeled samples is low, our semi-supervised approach outperforms the other approaches in almost all the cases.