Brain-Like Object Recognition with High-Performing Shallow Recurrent ANNs
  深い畳み込み人工ニューラルネットワーク(ANN)は、霊長類の腹側ストリームの視覚処理のメカニズムの候補モデルの主要なクラスです。当初は脳の解剖学に触発されていましたが、過去数年間、これらのANNはAlexNetの単純な8層アーキテクチャから非常に深く分岐したアーキテクチャに進化し、オブジェクト分類のパフォーマンスがますます向上していることを実証しながら、脳がどのように似ているかを疑問視しています。特に、機械学習コミュニティの典型的なディープモデルは、膨大な数のレイヤーと、再発などの生物学的に重要な接続が欠落しているため、脳の解剖学的構造にマッピングするのが難しいことがよくあります。ここでは、脳へのより良い解剖学的アライメントと、機械学習と神経科学の測定の高いパフォーマンスが矛盾する必要がないことを示します。霊長類の腹側視覚ストリームのモデルの機能的忠実度を定量化するための神経および行動のベンチマークの新しい大規模な複合体であるBrain-Scoreによって導かれる、4つの解剖学的にマッピングされた領域と繰り返しの接続性を持つ浅いANNであるCORnet-Sを開発しました。ほとんどのモデルよりもかなり浅いにもかかわらず、CORnet-SはBrain-Scoreのトップモデルであり、ImageNetの同様のコンパクトなモデルよりも優れています。さらに、CORnet-S回路バリアントの広範な分析により、再発がBrain-ScoreとImageNetのトップ1パフォーマンスの主要な予測因子であることが明らかになりました。最後に、CORnet-S "IT"神経集団の時間的進化が実際のサルのIT集団動態に似ていることを報告します。まとめると、これらの結果は、霊長類の腹側視覚ストリームの現在の最良のモデルとして、コンパクトで再発性のANNであるCORnet-Sを確立します。
Deep convolutional artificial neural networks (ANNs) are the leading class of candidate models of the mechanisms of visual processing in the primate ventral stream. While initially inspired by brain anatomy, over the past years, these ANNs have evolved from a simple eight-layer architecture in AlexNet to extremely deep and branching architectures, demonstrating increasingly better object categorization performance, yet bringing into question how brain-like they still are. In particular, typical deep models from the machine learning community are often hard to map onto the brain's anatomy due to their vast number of layers and missing biologically-important connections, such as recurrence. Here we demonstrate that better anatomical alignment to the brain and high performance on machine learning as well as neuroscience measures do not have to be in contradiction. We developed CORnet-S, a shallow ANN with four anatomically mapped areas and recurrent connectivity, guided by Brain-Score, a new large-scale composite of neural and behavioral benchmarks for quantifying the functional fidelity of models of the primate ventral visual stream. Despite being significantly shallower than most models, CORnet-S is the top model on Brain-Score and outperforms similarly compact models on ImageNet. Moreover, our extensive analyses of CORnet-S circuitry variants reveal that recurrence is the main predictive factor of both Brain-Score and ImageNet top-1 performance. Finally, we report that the temporal evolution of the CORnet-S "IT" neural population resembles the actual monkey IT population dynamics. Taken together, these results establish CORnet-S, a compact, recurrent ANN, as the current best model of the primate ventral visual stream.
updated: Mon Oct 28 2019 07:30:42 GMT+0000 (UTC)
published: Fri Sep 13 2019 12:09:34 GMT+0000 (UTC)
