Development of Fast Refinement Detectors on AI Edge Platforms
物体検出ネットワークの改善により、物体検出ネットワークのいくつかのバリエーションが印象的なパフォーマンスを達成しました。ただし、ほとんどのモデルのパフォーマンス評価は検出精度に重点を置いており、パフォーマンス検証は主にハイエンドGPUハードウェアに基づいています。この論文では、組み込みプラットフォーム上のリアルタイムシステムのバランスの取れたパフォーマンスを保証するリアルタイムオブジェクト検出器を提案します。提案されたモデルは、シングルショットオブジェクト検出器(SSD)の変形であるRefineDetモデルの基本的なヘッド構造を利用しています。リアルタイムのパフォーマンスを確保するために、比較的浅い層またはより少ないパラメーターを持つCNNモデルがバックボーン構造として使用されています。基本的なVGGNetおよびResNet構造に加えて、MobileNet、Xception、ResNeXt、Inception-SENet、SE-ResNeXtなどのさまざまなバックボーン構造がこの目的で使用されています。中間層の適切な組み合わせにより、オブジェクト検出ネットワークのトレーニングが成功しました。提案された検出器の精度は、MS-COCO 2017オブジェクト検出データセットの評価によって推定され、NVIDIA DrivePX2およびJetsonXavierボードの推論速度がテストされ、組み込みシステムのリアルタイムパフォーマンスが検証されました。実験は、提案されたモデルが、組み込みシステム環境での精度と推論速度の点でバランスの取れたパフォーマンスを保証することを示しています。さらに、ハイエンドGPUとは異なり、組み込みGPUの使用には、効率的な推論に関するいくつかの追加の懸念事項が含まれます。これらは、この作業で特定されています。コードとモデルは、Web(リンク)で公開されています。
With the improvements in the object detection networks, several variations of object detection networks have been achieved impressive performance. However, the performance evaluation of most models has focused on detection accuracy, and performance verification is mostly based on high-end GPU hardware. In this paper, we propose real-time object detectors that guarantee balanced performance for real-time systems on embedded platforms. The proposed model utilizes the basic head structure of the RefineDet model, which is a variant of the single-shot object detector (SSD). In order to ensure real-time performance, CNN models with relatively shallow layers or fewer parameters have been used as the backbone structure. In addition to the basic VGGNet and ResNet structures, various backbone structures such as MobileNet, Xception, ResNeXt, Inception-SENet, and SE-ResNeXt have been used for this purpose. Successful training of object detection networks was achieved through an appropriate combination of intermediate layers. The accuracy of the proposed detector was estimated by the evaluation of the MS-COCO 2017 object detection dataset and the inference speed on the NVIDIA Drive PX2 and Jetson Xavier boards were tested to verify real-time performance in the embedded systems. The experiments show that the proposed models ensure balanced performance in terms of accuracy and inference speed in the embedded system environments. In addition, unlike the high-end GPUs, the use of embedded GPUs involves several additional concerns for efficient inference, which have been identified in this work. The codes and models are publicly available on the web (link).
updated: Thu Nov 26 2020 03:46:53 GMT+0000 (UTC)
published: Tue Sep 24 2019 10:29:43 GMT+0000 (UTC)
