arXiv reaDer
EfficientDet: Scalable and Efficient Object Detection
モデルの効率は、コンピュータービジョンにおいてますます重要になっています。このホワイトペーパーでは、オブジェクト検出のためのニューラルネットワークアーキテクチャ設計の選択を体系的に調査し、効率を改善するためのいくつかの重要な最適化を提案します。まず、簡単で高速なマルチスケール機能融合を可能にする重み付き双方向機能ピラミッドネットワーク(BiFPN)を提案します。次に、すべてのバックボーン、フィーチャネットワーク、ボックス/クラス予測ネットワークの解像度、深度、幅を同時に均一にスケーリングする複合スケーリング方法を提案します。これらの最適化とより優れたバックボーンに基づいて、EfficientDetと呼ばれるオブジェクト検出器の新しいファミリを開発しました。これは、幅広いリソース制約にわたって従来技術よりもはるかに優れた効率を一貫して達成します。特に、単一モデルと単一スケールのEfficientDet-D7は、77Mパラメーターと410B FLOPを備えたCOCO test-devで最先端の55.1 APを実現し、4倍から9倍小さく、使用するFLOPが13倍から42倍少ない以前の検出器。コードはで入手できます。
Model efficiency has become increasingly important in computer vision. In this paper, we systematically study neural network architecture design choices for object detection and propose several key optimizations to improve efficiency. First, we propose a weighted bi-directional feature pyramid network (BiFPN), which allows easy and fast multiscale feature fusion; Second, we propose a compound scaling method that uniformly scales the resolution, depth, and width for all backbone, feature network, and box/class prediction networks at the same time. Based on these optimizations and better backbones, we have developed a new family of object detectors, called EfficientDet, which consistently achieve much better efficiency than prior art across a wide spectrum of resource constraints. In particular, with single model and single-scale, our EfficientDet-D7 achieves state-of-the-art 55.1 AP on COCO test-dev with 77M parameters and 410B FLOPs, being 4x - 9x smaller and using 13x - 42x fewer FLOPs than previous detectors. Code is available at
updated: Mon Jul 27 2020 15:55:16 GMT+0000 (UTC)
published: Wed Nov 20 2019 18:16:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト