多数の視覚タスクで印象的なパフォーマンスを発揮しますが、たたみ込みニューラルネットワーク(CNN)は、脳とは異なり、入力の小さな摂動(例:誤った判断につながる敵対的なノイズ。大規模な神経科学データを使用してCNNを正規化し、表現の類似性の観点からより堅牢な神経機能を学習することを提案します。マウスに自然な画像を提示し、皮質視覚野からの数千のニューロンの応答を測定しました。次に、マウス視覚システムからの応答のこの大きなコーパスで訓練された強力な予測モデルを使用して悪名高い可変神経活動をノイズ除去し、モデルの予測から数百万の画像ペアの表現の類似性を計算しました。次に、ニューラル表現の類似性を使用して、ニューラル表現から逸脱した中間表現にペナルティを課すことにより、画像分類で訓練されたCNNを正規化しました。これにより、標準ベンチマークで画像を分類するときにベースラインモデルのパフォーマンスが維持され、ノイズの多い画像を分類するときにベースラインモデルまたはコントロールモデルと比較して大幅に高いパフォーマンスが維持されます。さらに、皮質表現で正則化されたモデルは、敵の攻撃に関してモデルの堅牢性も改善しました。これは、ニューラルデータでの正則化が、より堅牢な推論への誘導バイアスを作成するための効果的なツールになり得ることを示しています。
Despite impressive performance on numerous visual tasks, Convolutional Neural Networks (CNNs) --- unlike brains --- are often highly sensitive to small perturbations of their input, e.g. adversarial noise leading to erroneous decisions. We propose to regularize CNNs using large-scale neuroscience data to learn more robust neural features in terms of representational similarity. We presented natural images to mice and measured the responses of thousands of neurons from cortical visual areas. Next, we denoised the notoriously variable neural activity using strong predictive models trained on this large corpus of responses from the mouse visual system, and calculated the representational similarity for millions of pairs of images from the model's predictions. We then used the neural representation similarity to regularize CNNs trained on image classification by penalizing intermediate representations that deviated from neural ones. This preserved performance of baseline models when classifying images under standard benchmarks, while maintaining substantially higher performance compared to baseline or control models when classifying noisy images. Moreover, the models regularized with cortical representations also improved model robustness in terms of adversarial attacks. This demonstrates that regularizing with neural data can be an effective tool to create an inductive bias towards more robust inference.