arXiv reaDer
マルチパスニューラルネットワークにおけるエンドツーエンドのデータ依存ルーティング
End-To-End Data-Dependent Routing in Multi-Path Neural Networks
ニューラルネットワークは、より抽象的な機能を学習できるため、深さが増すとパフォーマンスが向上することが知られています。ネットワークの深化は十分に確立されていますが、レイヤー内で効率的な特徴抽出の余地があり、単なるパラメーターの増分の必要性が減少します。各層にフィルターを追加することによる従来のネットワークの拡張では、パラメーターの2次増分が導入されます。各層に複数の並列畳み込み/高密度操作があると、この問題は解決しますが、これらの操作間でコンテキストに依存するリソースの割り当てはありません。並列計算は同様の機能を学習する傾向があり、拡張プロセスの効果が低下します。したがって、レイヤー内の並列計算間でデータに依存するリソース割り当てを行うマルチパスニューラルネットワークの使用を提案します。これにより、入力をこれらの並列パスを介してエンドツーエンドでルーティングすることもできます。これを行うために、最初に、後続のレイヤーの並列テンソル間に相互予測ベースのアルゴリズムを導入します。次に、連続するレイヤーの並列テンソル間に機能に依存する相互接続を導入することにより、ルーティングのオーバーヘッドをさらに削減します。当社のマルチパスネットワークは、既存の拡張および適応特徴抽出、さらにはアンサンブルよりも優れたパフォーマンスを示し、画像認識タスクにおいて同様の複雑さでより深いネットワークを示します。
Neural networks are known to give better performance with increased depth due to their ability to learn more abstract features. Although the deepening of networks has been well established, there is still room for efficient feature extraction within a layer which would reduce the need for mere parameter increment. The conventional widening of networks by having more filters in each layer introduces a quadratic increment of parameters. Having multiple parallel convolutional/dense operations in each layer solves this problem, but without any context-dependent allocation of resources among these operations: the parallel computations tend to learn similar features making the widening process less effective. Therefore, we propose the use of multi-path neural networks with data-dependent resource allocation among parallel computations within layers, which also lets an input to be routed end-to-end through these parallel paths. To do this, we first introduce a cross-prediction based algorithm between parallel tensors of subsequent layers. Second, we further reduce the routing overhead by introducing feature-dependent cross-connections between parallel tensors of successive layers. Our multi-path networks show superior performance to existing widening and adaptive feature extraction, and even ensembles, and deeper networks at similar complexity in the image recognition task.
updated: Tue Feb 28 2023 06:59:49 GMT+0000 (UTC)
published: Tue Jul 06 2021 07:58:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト