arXiv reaDer
YOLO Nano:一度だけ見ることができる非常にコンパクトなオブジェクト検出用畳み込みニューラルネットワーク
YOLO Nano: a Highly Compact You Only Look Once Convolutional Neural Network for Object Detection
  オブジェクト検出は、コンピュータビジョンの分野における研究の活発な分野であり、オブジェクト検出に取り組むための深い畳み込みニューラルネットワークの設計により、この分野でかなりの進歩と成功が達成されています。これらの成功にもかかわらず、エッジおよびモバイルシナリオでのそのようなオブジェクト検出ネットワークの広範な展開に対する最大の課題の1つは、高い計算およびメモリ要件です。そのため、エッジおよびモバイルでの使用に対応する効率的なディープニューラルネットワークアーキテクチャの設計に関心が高まっています。本研究では、オブジェクト検出タスク用の非常にコンパクトなディープ畳み込みニューラルネットワークであるYOLO Nanoを紹介します。人間と機械の協調設計戦略を活用して、YOLO Nanoを作成します。YOLONanoでは、シングルショットオブジェクト検出ネットワークアーキテクチャのYOLOファミリーの設計原理に基づく原則的なネットワーク設計プロトタイピングが、マシン駆動設計探査と組み合わされてコンパクトなネットワークを作成します高度にカスタマイズされたモジュールレベルのマクロアーキテクチャとマイクロアーキテクチャの設計で、埋め込みオブジェクト検出のタスクに合わせて調整されています。提案されているYOLO Nanoのモデルサイズは〜4.0MB(それぞれTiny YOLOv2およびTiny YOLOv3よりも> 15.1xおよび> 8.3x小さい)であり、推論には4.57Bの操作が必要です(Tiny YOLOv2およびVOC 2007データセットで〜69.1%のmAP(それぞれTiny YOLOv2とTiny YOLOv3よりもそれぞれ〜12%と〜10.7%高い)を達成しながら、それぞれTiny YOLOv3)。さまざまな電力バジェットでのJetson AGX Xavier組み込みモジュールの推論速度と電力効率に関する実験は、組み込みシナリオに対するYOLO Nanoの有効性をさらに実証しています。
Object detection remains an active area of research in the field of computer vision, and considerable advances and successes has been achieved in this area through the design of deep convolutional neural networks for tackling object detection. Despite these successes, one of the biggest challenges to widespread deployment of such object detection networks on edge and mobile scenarios is the high computational and memory requirements. As such, there has been growing research interest in the design of efficient deep neural network architectures catered for edge and mobile usage. In this study, we introduce YOLO Nano, a highly compact deep convolutional neural network for the task of object detection. A human-machine collaborative design strategy is leveraged to create YOLO Nano, where principled network design prototyping, based on design principles from the YOLO family of single-shot object detection network architectures, is coupled with machine-driven design exploration to create a compact network with highly customized module-level macroarchitecture and microarchitecture designs tailored for the task of embedded object detection. The proposed YOLO Nano possesses a model size of ~4.0MB (>15.1x and >8.3x smaller than Tiny YOLOv2 and Tiny YOLOv3, respectively) and requires 4.57B operations for inference (>34% and ~17% lower than Tiny YOLOv2 and Tiny YOLOv3, respectively) while still achieving an mAP of ~69.1% on the VOC 2007 dataset (~12% and ~10.7% higher than Tiny YOLOv2 and Tiny YOLOv3, respectively). Experiments on inference speed and power efficiency on a Jetson AGX Xavier embedded module at different power budgets further demonstrate the efficacy of YOLO Nano for embedded scenarios.
updated: Thu Oct 03 2019 01:29:26 GMT+0000 (UTC)
published: Thu Oct 03 2019 01:29:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト