arXiv reaDer
並列カスケードネットワークと時間差損失によるいつでも予測の改善
Improving Anytime Prediction with Parallel Cascaded Networks and a Temporal-Difference Loss
ディープフィードフォワードニューラルネットワークは霊長類の視覚系といくつかの特徴を共有していますが、重要な違いはそれらのダイナミクスです。ディープネットは通常、次のレイヤーで処理が開始される前に各レイヤーが計算を完了するシリアルステージで動作します。対照的に、生物学的システムにはカスケードダイナミクスがあります。情報はすべての層のニューロンから並行して伝播しますが、伝達は時間の経過とともに徐々に発生し、フィードフォワードアーキテクチャでも速度と精度のトレードオフにつながります。カスケードされたResNetを構築することにより、生物学的に着想を得た並列ハードウェアの結果を調査します。この場合、残りの各ブロックには伝播遅延がありますが、すべてのブロックはステートフルな方法で並列に更新されます。スキップ接続を介して送信される情報は遅延を回避するため、アーキテクチャの機能の深さは時間の経過とともに増加し、内部処理時間とともに改善されるいつでも予測が得られます。標準損失よりも厳密に優れた速度精度プロファイルを実現し、カスケードアーキテクチャが最先端のいつでも予測方法よりも優れたパフォーマンスを発揮できるようにする時間差トレーニング損失を紹介します。カスケードアーキテクチャには、次のような興味深い特性があります。非定型インスタンスよりも一般的なインスタンスをより迅速に分類します。従来のResNetよりも、永続的なノイズと一時的なノイズの両方に対して堅牢です。そして、その時変出力トレースは、情報処理と推論を改善するために利用できる信号を提供します。
Although deep feedforward neural networks share some characteristics with the primate visual system, a key distinction is their dynamics. Deep nets typically operate in serial stages wherein each layer completes its computation before processing begins in subsequent layers. In contrast, biological systems have cascaded dynamics: information propagates from neurons at all layers in parallel but transmission occurs gradually over time, leading to speed-accuracy trade offs even in feedforward architectures. We explore the consequences of biologically inspired parallel hardware by constructing cascaded ResNets in which each residual block has propagation delays but all blocks update in parallel in a stateful manner. Because information transmitted through skip connections avoids delays, the functional depth of the architecture increases over time, yielding anytime predictions that improve with internal-processing time. We introduce a temporal-difference training loss that achieves a strictly superior speed-accuracy profile over standard losses and enables the cascaded architecture to outperform state-of-the-art anytime-prediction methods. The cascaded architecture has intriguing properties, including: it classifies typical instances more rapidly than atypical instances; it is more robust to both persistent and transient noise than is a conventional ResNet; and its time-varying output trace provides a signal that can be exploited to improve information processing and inference.
updated: Fri Jun 11 2021 06:15:12 GMT+0000 (UTC)
published: Fri Feb 19 2021 08:40:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト