arXiv reaDer
HeteroEdge: 異種協調自律システムにおける非対称性への対処
HeteroEdge: Addressing Asymmetry in Heterogeneous Collaborative Autonomous Systems
環境に関する知識を収集し、IoT デバイスの状況認識を生成することは、スマートな都市環境や競争のない環境向けに開発されたシステムにとって最も重要です。たとえば、広域監視システムには、通常、カメラや LIDAR などのマルチモーダル センサーが装備されており、アクション、顔、行動、物体認識のためのディープ ラーニング アルゴリズムを実行する必要があります。ただし、これらのシステムは、そのユビキタスな性質のために電力とメモリの制約に直面しており、データ処理、ディープ ラーニング アルゴリズムの入力、およびモデル推論通信を最適化することが重要です。このホワイト ペーパーでは、2 台の無人地上車両 (UGV) と 2 台の NVIDIA Jetson デバイスで構成されるテストベッドの自己適応型最適化フレームワークを提案します。このフレームワークは、異種ノード上で同時に複数のタスク (ストレージ、処理、計算、送信、推論) を効率的に管理します。これには、入力画像フレームの圧縮とマスキング、類似フレームの識別、最適化のための境界条件を取得するためのデバイスのプロファイリングが含まれます。テストベッド内のデバイスのネットワーク帯域幅、ビジー ファクター、メモリ (CPU、GPU、RAM)、および電力の制約を考慮しながらデバイスを選択します。複数のタスク (PoseNet、SegNet、ImageNet、DetectNet、DepthNet など) を同時に実行しているときに取得した評価では、補助ノードでデータの 70% (分割比率 = 70%) を実行すると、オフロードのレイテンシが約約 33% (18.7 ms/画像から 12.5 ms/画像)、総動作時間は約 1 時間短縮されます。ベースライン構成 (プライマリ ノードで実行) と比較して 47% (69.32 秒から 36.43 秒)。
Gathering knowledge about surroundings and generating situational awareness for IoT devices is of utmost importance for systems developed for smart urban and uncontested environments. For example, a large-area surveillance system is typically equipped with multi-modal sensors such as cameras and LIDARs and is required to execute deep learning algorithms for action, face, behavior, and object recognition. However, these systems face power and memory constraints due to their ubiquitous nature, making it crucial to optimize data processing, deep learning algorithm input, and model inference communication. In this paper, we propose a self-adaptive optimization framework for a testbed comprising two Unmanned Ground Vehicles (UGVs) and two NVIDIA Jetson devices. This framework efficiently manages multiple tasks (storage, processing, computation, transmission, inference) on heterogeneous nodes concurrently. It involves compressing and masking input image frames, identifying similar frames, and profiling devices to obtain boundary conditions for optimization.. Finally, we propose and optimize a novel parameter split-ratio, which indicates the proportion of the data required to be offloaded to another device while considering the networking bandwidth, busy factor, memory (CPU, GPU, RAM), and power constraints of the devices in the testbed. Our evaluations captured while executing multiple tasks (e.g., PoseNet, SegNet, ImageNet, DetectNet, DepthNet) simultaneously, reveal that executing 70% (split-ratio=70%) of the data on the auxiliary node minimizes the offloading latency by approx. 33% (18.7 ms/image to 12.5 ms/image) and the total operation time by approx. 47% (69.32s to 36.43s) compared to the baseline configuration (executing on the primary node).
updated: Fri May 05 2023 02:43:16 GMT+0000 (UTC)
published: Fri May 05 2023 02:43:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト