ApproxNet: Content and Contention-Aware Video Analytics System for Embedded Clients
ビデオはネットワーク経由で転送するのに長い時間がかかるため、組み込みデバイスまたはモバイルデバイスでライブビデオの分析を実行することが重要なシステムドライバーになっています。監視カメラやAR / VRガジェットなどのそのようなデバイスはリソースに制約があることを考えると、組み込みデバイス用の軽量のディープニューラルネットワーク(DNN)を作成することが重要です。オブジェクト分類DNNの現在の近似手法はいずれも、デバイスでのリソースの可用性、コンテンツの特性、またはユーザーからの要件の変更など、実行時の条件の変化に適応できません。本稿では、組み込みクライアントまたはモバイルクライアント向けのビデオオブジェクト分類システムであるApproxNetを紹介します。これにより、新しい動的近似手法を使用して、実行時の条件が変化しても、必要な推論の待ち時間と精度のトレードオフを実現できます。これは、モデルのアンサンブル(MCDNN [MobiSys-16]など)を作成および維持するのではなく、単一のDNNモデル内で2つの近似ノブを有効にすることで実現されます。画像とビデオのフレーム分類問題の遅延。ResNet[CVPR-16]、MCDNN [MobiSys-16]、MobileNets [Google-17]、NestDNN [MobiCom-18]、MSDNet [ ICLR-18]。
Videos take a lot of time to transport over the network, hence running analytics on the live video on embedded or mobile devices has become an important system driver. Considering that such devices, e.g., surveillance cameras or AR/VR gadgets, are resource constrained, creating lightweight deep neural networks (DNNs) for embedded devices is crucial. None of the current approximation techniques for object classification DNNs can adapt to changing runtime conditions, e.g., changes in resource availability on the device, the content characteristics, or requirements from the user. In this paper, we introduce ApproxNet, a video object classification system for embedded or mobile clients. It enables novel dynamic approximation techniques to achieve desired inference latency and accuracy trade-off under changing runtime conditions. It achieves this by enabling two approximation knobs within a single DNN model, rather than creating and maintaining an ensemble of models (e.g., MCDNN [MobiSys-16]. We show that ApproxNet can adapt seamlessly at runtime to these changes, provides low and stable latency for the image and video frame classification problems, and show the improvement in accuracy and latency over ResNet [CVPR-16], MCDNN [MobiSys-16], MobileNets [Google-17], NestDNN [MobiCom-18], and MSDNet [ICLR-18].
updated: Wed Jul 14 2021 20:22:04 GMT+0000 (UTC)
published: Wed Aug 28 2019 19:29:41 GMT+0000 (UTC)
