arXiv reaDer
早期終了を使用した深層ニューラル ネットワークの階層トレーニング
Hierarchical Training of Deep Neural Networks Using Early Exiting
ディープ ニューラル ネットワークは、ビジョン タスクに最先端の精度を提供しますが、トレーニングにはかなりのリソースが必要です。したがって、それらは、データを取得するエッジ デバイスから離れたクラウド サーバーでトレーニングされます。この問題により、通信コスト、実行時間、およびプライバシーに関する懸念が高まります。この研究では、エッジ ワーカーとクラウド ワーカーの間の分割されたアーキテクチャで早期終了を使用して、通信コスト、トレーニングの実行時間、およびプライバシーの問題を軽減する、ディープ ニューラル ネットワークの新しい階層トレーニング方法が提案されています。この方法は、トレーニング フェーズ中にエッジとクラウドの間でニューラル ネットワークのバックワード パスを分離するための早期終了のまったく新しいユース ケースを提案します。トレーニング フェーズのシーケンシャルな性質のために、階層のレベルを同時にトレーニングできない、またはプライバシーを侵害するコストをかけて行う、ほとんどの利用可能な方法の問題に対処します。対照的に、私たちの方法は、エッジ ワーカーとクラウド ワーカーの両方を同時に使用でき、生の入力データをクラウドと共有せず、バックワード パス中の通信を必要としません。さまざまなニューラル ネットワーク アーキテクチャのいくつかのシミュレーションとデバイス上での実験により、この方法の有効性が実証されています。 VGG-16 と ResNet-18 の CIFAR-10 分類実験で、クラウドとの通信が低ビットレート チャネルで行われる場合、提案された方法はトレーニングの実行時間を 29% と 61% 削減することが示されています。このランタイムの向上は達成されますが、精度の低下は無視できます。この方法は、エッジ クラウド システムの一部として携帯電話やロボットなどのリソースの少ないデバイスで高精度のディープ ニューラル ネットワークをオンラインで学習する場合に有利であり、新しいタスクやデータのクラスに直面する際により柔軟になります。
Deep neural networks provide state-of-the-art accuracy for vision tasks but they require significant resources for training. Thus, they are trained on cloud servers far from the edge devices that acquire the data. This issue increases communication cost, runtime and privacy concerns. In this study, a novel hierarchical training method for deep neural networks is proposed that uses early exits in a divided architecture between edge and cloud workers to reduce the communication cost, training runtime and privacy concerns. The method proposes a brand-new use case for early exits to separate the backward pass of neural networks between the edge and the cloud during the training phase. We address the issues of most available methods that due to the sequential nature of the training phase, cannot train the levels of hierarchy simultaneously or they do it with the cost of compromising privacy. In contrast, our method can use both edge and cloud workers simultaneously, does not share the raw input data with the cloud and does not require communication during the backward pass. Several simulations and on-device experiments for different neural network architectures demonstrate the effectiveness of this method. It is shown that the proposed method reduces the training runtime by 29% and 61% in CIFAR-10 classification experiment for VGG-16 and ResNet-18 when the communication with the cloud is done at a low bit rate channel. This gain in the runtime is achieved whilst the accuracy drop is negligible. This method is advantageous for online learning of high-accuracy deep neural networks on low-resource devices such as mobile phones or robots as a part of an edge-cloud system, making them more flexible in facing new tasks and classes of data.
updated: Sun Mar 19 2023 14:39:50 GMT+0000 (UTC)
published: Sat Mar 04 2023 11:30:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト