すべてのニューラルネットワークアーキテクチャが同等に作成されているわけではなく、特定のタスクで他のアーキテクチャよりもパフォーマンスがはるかに優れているものもあります。しかし、ニューラルネットワークの重みパラメータは、そのアーキテクチャと比較してどれほど重要ですか?この作業では、重みパラメータを学習しなくても、ニューラルネットワークアーキテクチャだけで、特定のタスクのソリューションをどの程度までエンコードできるかを質問します。明示的なウェイトトレーニングなしでタスクを既に実行できるニューラルネットワークアーキテクチャの検索方法を提案します。これらのネットワークを評価するために、均一なランダム分布からサンプリングされた単一の共有重みパラメーターを接続に取り込み、予想されるパフォーマンスを測定します。私たちの方法は、ウェイトトレーニングなしでいくつかの強化学習タスクを実行できる最小限のニューラルネットワークアーキテクチャを見つけることができることを示しています。監視された学習ドメインでは、ランダムな重みを使用してMNISTで偶然の精度よりもはるかに高いネットワークアーキテクチャを見つけます。この論文のインタラクティブバージョンは、https://weightagnostic.github.io/
Not all neural network architectures are created equal, some perform much better than others for certain tasks. But how important are the weight parameters of a neural network compared to its architecture? In this work, we question to what extent neural network architectures alone, without learning any weight parameters, can encode solutions for a given task. We propose a search method for neural network architectures that can already perform a task without any explicit weight training. To evaluate these networks, we populate the connections with a single shared weight parameter sampled from a uniform random distribution, and measure the expected performance. We demonstrate that our method can find minimal neural network architectures that can perform several reinforcement learning tasks without weight training. On a supervised learning domain, we find network architectures that achieve much higher than chance accuracy on MNIST using random weights. Interactive version of this paper at https://weightagnostic.github.io/