NAS-FCOS: Fast Neural Architecture Search for Object Detection
 ディープニューラルネットワークの成功は、重要なアーキテクチャエンジニアリングに依存しています。最近、ニューラルアーキテクチャ検索(NAS)は、最適なアーキテクチャを自動的に検索することにより、ネットワーク設計の手作業を大幅に削減する約束として浮上しましたが、通常、このようなアルゴリズムには過剰な量の計算リソース、たとえば数千GPU日が必要です。これまで、オブジェクト検出などの困難なビジョンタスクでは、NAS、特にNASの高速バージョンについてはあまり研究されていません。ここでは、検索効率を考慮してオブジェクト検出器のデコーダー構造を検索することを提案します。具体的には、カスタマイズされた強化学習パラダイムを使用して、フィーチャピラミッドネットワーク(FPN)と、アンカーのない単純なオブジェクト検出器(FCOS)の予測ヘッドを効率的に検索することを目指しています。慎重に設計された検索スペース、検索アルゴリズム、およびネットワーク品質を評価するための戦略により、8 V100 GPUを使用して4日以内に最高性能の検出アーキテクチャを効率的に検索できます。発見されたアーキテクチャは、COCOデータセットのAPで最先端のオブジェクト検出モデル(Faster R-CNN、RetinaNet、FCOSなど)を1.5〜3.5ポイント上回っており、計算の複雑さとメモリフットプリントが同等であるため、提案されているオブジェクト検出用のNAS。
The success of deep neural networks relies on significant architecture engineering. Recently neural architecture search (NAS) has emerged as a promise to greatly reduce manual effort in network design by automatically searching for optimal architectures, although typically such algorithms need an excessive amount of computational resources, e.g., a few thousand GPU-days. To date, on challenging vision tasks such as object detection, NAS, especially fast versions of NAS, is less studied. Here we propose to search for the decoder structure of object detectors with search efficiency being taken into consideration. To be more specific, we aim to efficiently search for the feature pyramid network (FPN) as well as the prediction head of a simple anchor-free object detector, namely FCOS, using a tailored reinforcement learning paradigm. With carefully designed search space, search algorithms and strategies for evaluating network quality, we are able to efficiently search a top-performing detection architecture within 4 days using 8 V100 GPUs. The discovered architecture surpasses state-of-the-art object detection models (such as Faster R-CNN, RetinaNet and FCOS) by 1.5 to 3.5 points in AP on the COCO dataset, with comparable computation complexity and memory footprint, demonstrating the efficacy of the proposed NAS for object detection.
updated: Tue Feb 25 2020 08:05:47 GMT+0000 (UTC)
published: Tue Jun 11 2019 07:55:41 GMT+0000 (UTC)
