arXiv reaDer
A System-Level Solution for Low-Power Object Detection
  深層学習の助けを借りて、オブジェクト検出は近年目覚しい進歩を遂げています。ただし、最先端のアルゴリズムは計算とメモリの両方を集中的に使用します。多くの軽量ネットワークは、精度と効率のトレードオフのために開発されていますが、組み込みデバイスで実用的にすることは依然として課題です。このホワイトペーパーでは、異種の組み込みデバイスでの効率的なオブジェクト検出のためのシステムレベルのソリューションを紹介します。検出ネットワークは低ビットに量子化され、シフト演算子を使用して効率的に実装できます。低ビット量子化の利点を最大限に活用するために、プログラマブルロジックを備えた専用アクセラレータを設計しています。アクセラレータの内部では、さまざまな畳み込み層の異種特性に応じてハイブリッドデータフローが活用されます。わかりやすいがリソースに優しい列優先タイリング戦略を採用して、計算集約的な畳み込み層を、任意の機能サイズをサポートできるアクセラレータにマッピングします。他の操作は低電力CPUコアで実行でき、システム全体がパイプライン方式で実行されます。ケーススタディとして、入力サイズ512x512の実世界監視ビデオでオブジェクト検出システムを評価し、システムが6.9W(ディスプレイ付き)のコストで18 fpsの推論速度を達成できることがわかりました。 PASCAL VOC 2012データセットで検証された66.4のmAP。
Object detection has made impressive progress in recent years with the help of deep learning. However, state-of-the-art algorithms are both computation and memory intensive. Though many lightweight networks are developed for a trade-off between accuracy and efficiency, it is still a challenge to make it practical on an embedded device. In this paper, we present a system-level solution for efficient object detection on a heterogeneous embedded device. The detection network is quantized to low bits and allows efficient implementation with shift operators. In order to make the most of the benefits of low-bit quantization, we design a dedicated accelerator with programmable logic. Inside the accelerator, a hybrid dataflow is exploited according to the heterogeneous property of different convolutional layers. We adopt a straightforward but resource-friendly column-prior tiling strategy to map the computation-intensive convolutional layers to the accelerator that can support arbitrary feature size. Other operations can be performed on the low-power CPU cores, and the entire system is executed in a pipelined manner. As a case study, we evaluate our object detection system on a real-world surveillance video with input size of 512x512, and it turns out that the system can achieve an inference speed of 18 fps at the cost of 6.9W (with display) with an mAP of 66.4 verified on the PASCAL VOC 2012 dataset.
updated: Sat Oct 19 2019 13:57:12 GMT+0000 (UTC)
published: Tue Sep 24 2019 14:45:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト