人間の視覚システムは、周囲の世界を認識できるようにする脳領域の複雑なネットワークです。豊富な横方向およびフィードバック接続にもかかわらず、オブジェクト処理は一般にフィードフォワードプロセスと見なされ、研究されています。ここでは、時間分解脳イメージングと深層学習を使用して、人間の腹側の流れの複数の段階にわたって急速な表象ダイナミクスを測定およびモデル化します。腹側流域内および腹側流域での処理の最初の300ミリ秒の間に、実質的な代表的な変換が観察されます。カテゴリ分割は、順を追って出現し、地域全体で順方向および逆方向にカスケードします。グレンジャー因果分析は、地域間の双方向情報フローを示唆しています。最後に、リカレントディープニューラルネットワークモデルは、複数領域の皮質ダイナミクスをキャプチャする能力の点で、パラメーターが一致したフィードフォワードモデルより明らかに優れています。リカレントディープネットワークモデルを対象とした仮想冷却実験により、横方向およびトップダウン接続の重要性がさらに実証されます。これらの結果は、人間の腹部の流れの情報処理を理解するために、反復モデルが必要であることを確立しています。
The human visual system is an intricate network of brain regions that enables us to recognize the world around us. Despite its abundant lateral and feedback connections, object processing is commonly viewed and studied as a feedforward process. Here, we measure and model the rapid representational dynamics across multiple stages of the human ventral stream using time-resolved brain imaging and deep learning. We observe substantial representational transformations during the first 300 ms of processing within and across ventral-stream regions. Categorical divisions emerge in sequence, cascading forward and in reverse across regions, and Granger causality analysis suggests bidirectional information flow between regions. Finally, recurrent deep neural network models clearly outperform parameter-matched feedforward models in terms of their ability to capture the multi-region cortical dynamics. Targeted virtual cooling experiments on the recurrent deep network models further substantiate the importance of their lateral and top-down connections. These results establish that recurrent models are required to understand information processing in the human ventral stream.