私たちは、網膜中心窩ピットに触発された差分ガウス フィルターとランク順エンコーディングを組み込んだスパイク畳み込みニューラル ネットワーク (SCNN) を発表しました。モデルは、Nengo ライブラリに実装されているように、スパイキング ニューロンで動作するように適合されたバックプロパゲーション アルゴリズムのバリアントを使用してトレーニングされます。公開されている 2 つのデータセットでモデルのパフォーマンスを評価しました。1 つは数字認識タスク用、もう 1 つは車両認識タスク用です。ネットワークは最大 90% の精度を達成しており、損失はクロスエントロピー関数を使用して計算されます。これは、ニューラル フィルタリングを使用せずに分類を実行する代替アプローチで得られた約 57% の精度よりも向上しています。全体として、私たちの概念実証研究は、既存の SCNN アーキテクチャに生物学的にもっともらしいフィルタリングを導入すると、車両認識タスクのようなノイズの多い入力画像でうまく機能することを示しています。結果に基づいて、ランク順序付けの前に横方向の抑制ベースの冗長性削減を統合することにより、SCNN を強化する予定です。これにより、ネットワークによる分類精度がさらに向上します。
We have presented a Spiking Convolutional Neural Network (SCNN) that incorporates retinal foveal-pit inspired Difference of Gaussian filters and rank-order encoding. The model is trained using a variant of the backpropagation algorithm adapted to work with spiking neurons, as implemented in the Nengo library. We have evaluated the performance of our model on two publicly available datasets - one for digit recognition task, and the other for vehicle recognition task. The network has achieved up to 90% accuracy, where loss is calculated using the cross-entropy function. This is an improvement over around 57% accuracy obtained with the alternate approach of performing the classification without any kind of neural filtering. Overall, our proof-of-concept study indicates that introducing biologically plausible filtering in existing SCNN architecture will work well with noisy input images such as those in our vehicle recognition task. Based on our results, we plan to enhance our SCNN by integrating lateral inhibition-based redundancy reduction prior to rank-ordering, which will further improve the classification accuracy by the network.