arXiv reaDer
目に見える以上のもの:脳活動からの自己監視深度再構成
More Than Meets the Eye: Self-Supervised Depth Reconstruction From Brain Activity
過去数年間で、深層学習ツールを使用したfMRI脳記録からの観察された自然画像の再構成に大きな進歩が見られました。ここでは、初めて、観察された2D自然画像の高密度3D深度マップがfMRI脳記録から直接復元できることを示します。既成の方法を使用して、自然画像の未知の深度マップを推定します。これは、(i)fMRIスキャナーで被験者に提示される少数の画像(fMRI記録がある画像-「ペア」データと呼ばれる)と(ii)非常に多数の自然画像の両方に適用されます。 fMRI記録なし(「対になっていないデータ」)。次に、推定された深度マップは、fMRIから直接深度再構成をトレーニングするための補助再構成基準として使用されます。 2つの主要なアプローチを提案します:深度のみの回復と共同画像深度RGBD回復。利用可能な「ペア」トレーニングデータ(fMRIを使用した画像)の数が少ないため、多くの「ペア」データ(fMRIを使用しない自然画像と深度マップ)に対する自己監視サイクル整合トレーニングを介してトレーニングデータを強化します。これは、再構成基準として、新しく定義およびトレーニングされた深度ベースの知覚的類似性メトリックを使用して実現されます。 fMRIから直接深度マップを予測することは、再構成された画像からの間接的な順次回復よりも優れていることを示します。さらに、初期の皮質視覚野からの活性化が深度再構成の結果を支配することを示し、深度情報の調整の程度によってfMRIボクセルを特徴付ける手段を提案します。この作業は、デコードされた情報の重要なレイヤーを追加し、視覚的な脳のデコード機能の現在のエンベロープを拡張します。
In the past few years, significant advancements were made in reconstruction of observed natural images from fMRI brain recordings using deep-learning tools. Here, for the first time, we show that dense 3D depth maps of observed 2D natural images can also be recovered directly from fMRI brain recordings. We use an off-the-shelf method to estimate the unknown depth maps of natural images. This is applied to both: (i) the small number of images presented to subjects in an fMRI scanner (images for which we have fMRI recordings - referred to as "paired" data), and (ii) a very large number of natural images with no fMRI recordings ("unpaired data"). The estimated depth maps are then used as an auxiliary reconstruction criterion to train for depth reconstruction directly from fMRI. We propose two main approaches: Depth-only recovery and joint image-depth RGBD recovery. Because the number of available "paired" training data (images with fMRI) is small, we enrich the training data via self-supervised cycle-consistent training on many "unpaired" data (natural images & depth maps without fMRI). This is achieved using our newly defined and trained Depth-based Perceptual Similarity metric as a reconstruction criterion. We show that predicting the depth map directly from fMRI outperforms its indirect sequential recovery from the reconstructed images. We further show that activations from early cortical visual areas dominate our depth reconstruction results, and propose means to characterize fMRI voxels by their degree of depth-information tuning. This work adds an important layer of decoded information, extending the current envelope of visual brain decoding capabilities.
updated: Tue Mar 22 2022 10:44:32 GMT+0000 (UTC)
published: Wed Jun 09 2021 14:46:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト