arXiv reaDer
FemtoDet: エネルギーとパフォーマンスのトレードオフを考慮した物体検出ベースライン
FemtoDet: An Object Detection Baseline for Energy Versus Performance Tradeoffs
エッジ デバイスの効率的な検出器は、パラメータまたは速度カウント メトリクスに合わせて最適化されていることが多く、これらは検出器のエネルギーと弱い相関関係にあります。ただし、常時オンの監視カメラなど、畳み込みニューラル ネットワークの一部のビジョン アプリケーションは、エネルギー制約にとって重要です。この論文は、次の 2 つの観点からエネルギーとパフォーマンスの間のトレードオフに達する検出器を設計することにより、ベースラインとして機能することを目的としています。 1) 活性化関数、畳み込み演算子、ネック上の特徴融合構造の選択など、低エネルギー アーキテクチャを特定するためにさまざまな CNN を広範囲に分析します。 。過去の研究で過小評価されてきたこれらの詳細は、検出器のエネルギー消費に深刻な影響を与えます。 2) エネルギー性能のジレンマを打開するために、FemtoDet という発見された低エネルギーコンポーネントを使用して、エネルギーによって駆動される平衡型検出器を提案します。新しい構造に加えて、畳み込みとトレーニング戦略の最適化を考慮することで FemtoDet を改善します。具体的には、CNNの限られた能力と多様な空間表現における検出タスクの間の矛盾を克服するための畳み込み最適化のための新しいインスタンス境界強化(IBE)モジュールを開発し、回避するためのトレーニング戦略を最適化するための再帰的ウォームリスタート(RecWR)を提案します。一般的な拡張で生成されるデータシフトを考慮した軽量検出器の部分最適化。その結果、わずか 68.77k のパラメーターを持つ FemtoDet は、PASCAL VOC で 46.3 AP50 の競争力のあるスコア、Qualcomm Snapdragon 865 CPU プラットフォームで 1.11 W & 64.47 FPS を達成しました。 COCO および TJU-DHD データセットに関する広範な実験により、提案された方法がさまざまなシーンで競合する結果を達成できることが示されています。
Efficient detectors for edge devices are often optimized for parameters or speed count metrics, which remain in weak correlation with the energy of detectors. However, some vision applications of convolutional neural networks, such as always-on surveillance cameras, are critical for energy constraints. This paper aims to serve as a baseline by designing detectors to reach tradeoffs between energy and performance from two perspectives: 1) We extensively analyze various CNNs to identify low-energy architectures, including selecting activation functions, convolutions operators, and feature fusion structures on necks. These underappreciated details in past work seriously affect the energy consumption of detectors; 2) To break through the dilemmatic energy-performance problem, we propose a balanced detector driven by energy using discovered low-energy components named FemtoDet. In addition to the novel construction, we improve FemtoDet by considering convolutions and training strategy optimizations. Specifically, we develop a new instance boundary enhancement (IBE) module for convolution optimization to overcome the contradiction between the limited capacity of CNNs and detection tasks in diverse spatial representations, and propose a recursive warm-restart (RecWR) for optimizing training strategy to escape the sub-optimization of light-weight detectors by considering the data shift produced in popular augmentations. As a result, FemtoDet with only 68.77k parameters achieves a competitive score of 46.3 AP50 on PASCAL VOC and 1.11 W \& 64.47 FPS on Qualcomm Snapdragon 865 CPU platforms. Extensive experiments on COCO and TJU-DHD datasets indicate that the proposed method achieves competitive results in diverse scenes.
updated: Mon Jul 17 2023 02:40:42 GMT+0000 (UTC)
published: Tue Jan 17 2023 06:24:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト