arXiv reaDer
SkyNet: a Hardware-Efficient Method for Object Detection and Tracking on Embedded Systems
 オブジェクトの検出と追跡は、リソースに制約のある組み込みシステムにとって難しいタスクです。これらのタスクは、人工知能ドメインの最も計算集約的なタスクの1つですが、組み込みデバイスでは限られた計算およびメモリリソースのみを使用できます。一方、このようなリソースに制約のある実装は、リアルタイムレスポンス、ハイスループットパフォーマンス、信頼性の高い推論精度などの追加の厳しい要件を満たすために必要になることがよくあります。これらの課題を克服するために、組み込みシステムに最先端の検出精度と速度を提供するハードウェア効率の高いニューラルネットワークであるSkyNetを提案します。コンパクトなDNN(ディープニューラルネットワーク)設計の一般的なトップダウンフローに従う代わりに、SkyNetは、ハードウェア効率の高いDNNを提供するために最初からハードウェアの制約を包括的に理解するボトムアップDNN設計アプローチを提供します。 SkyNetの有効性は、第56回IEEE / ACMデザイン自動化会議(DAC-SDC)で低電力オブジェクト検出の競争力のあるシステムデザインコンテストで優勝しました。 (IoU)およびTX2組み込みGPU上の67.33フレーム/秒(FPS)。 Ultra96組み込みFPGAで0.716 IoUおよび25.05 FPS。 SkyNetの評価は、最近の大規模な汎用オブジェクト追跡用の大規模高多様性ベンチマークであるGOT-10Kにも拡張されています。 ResNet-50をバックボーンとして使用する最先端のオブジェクトトラッカーSiamRPN ++およびSiamMaskの場合、SkyNetをバックボーンDNNとして使用する実装は、1080Ti GPUで実行する場合、1.60倍および1.73倍速く、より正確または同等の精度です。 、およびメモリとストレージのフットプリントを大幅に改善するために、パラメータサイズが37.20X小さくなりました。
Object detection and tracking are challenging tasks for resource-constrained embedded systems. While these tasks are among the most compute-intensive tasks from the artificial intelligence domain, they are only allowed to use limited computation and memory resources on embedded devices. In the meanwhile, such resource-constrained implementations are often required to satisfy additional demanding requirements such as real-time response, high-throughput performance, and reliable inference accuracy. To overcome these challenges, we propose SkyNet, a hardware-efficient neural network to deliver the state-of-the-art detection accuracy and speed for embedded systems. Instead of following the common top-down flow for compact DNN (Deep Neural Network) design, SkyNet provides a bottom-up DNN design approach with comprehensive understanding of the hardware constraints at the very beginning to deliver hardware-efficient DNNs. The effectiveness of SkyNet is demonstrated by winning the competitive System Design Contest for low power object detection in the 56th IEEE/ACM Design Automation Conference (DAC-SDC), where our SkyNet significantly outperforms all other 100+ competitors: it delivers 0.731 Intersection over Union (IoU) and 67.33 frames per second (FPS) on a TX2 embedded GPU; and 0.716 IoU and 25.05 FPS on an Ultra96 embedded FPGA. The evaluation of SkyNet is also extended to GOT-10K, a recent large-scale high-diversity benchmark for generic object tracking in the wild. For state-of-the-art object trackers SiamRPN++ and SiamMask, where ResNet-50 is employed as the backbone, implementations using our SkyNet as the backbone DNN are 1.60X and 1.73X faster with better or similar accuracy when running on a 1080Ti GPU, and 37.20X smaller in terms of parameter size for significantly better memory and storage footprint.
updated: Sat Feb 29 2020 22:48:22 GMT+0000 (UTC)
published: Fri Sep 20 2019 20:26:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト