視覚野で経験的に観察されたスパイクタイミング依存可塑性(STDP)学習を備えたスパイク皮質アンサンブルを説明する最適化ベースの理論を提示します。私たちのメソッドを使用して、イベントベースのカメラ用に完全に接続された畳み込みおよびアクションベースの特徴記述子のクラスを構築します。これらは、N-MNIST、チャレンジングCIFAR10-DVS、およびIBMDVS128ジェスチャデータセットでそれぞれ評価されます。従来の最先端のイベントベースの機能記述子と比較して、大幅な精度の向上を報告します(CIFAR10-DVSで+ 8%)。最先端のSTDPベースのシステムと比較して精度が大幅に向上したことを報告します(N-MNISTで+ 10%、IBM DVS128Gestureで+ 7.74%)。ニューロモルフィックエッジデバイスでの超低電力学習に加えて、私たちの仕事は、生物学的に現実的な最適化ベースの皮質視覚理論への道を開くのに役立ちます。
We present an optimization-based theory describing spiking cortical ensembles equipped with Spike-Timing-Dependent Plasticity (STDP) learning, as empirically observed in the visual cortex. Using our methods, we build a class of fully-connected, convolutional and action-based feature descriptors for event-based camera that we respectively assess on N-MNIST, challenging CIFAR10-DVS and on the IBM DVS128 gesture dataset. We report significant accuracy improvements compared to conventional state-of-the-art event-based feature descriptors (+8% on CIFAR10-DVS). We report large improvements in accuracy compared to state-of-the-art STDP-based systems (+10% on N-MNIST, +7.74% on IBM DVS128 Gesture). In addition to ultra-low-power learning in neuromorphic edge devices, our work helps paving the way towards a biologically-realistic, optimization-based theory of cortical vision.