最近、ニューラルアーキテクチャ検索(NAS)を利用して、特徴ピラミッドネットワーク(FPN)を設計し、視覚的なオブジェクト検出に有望な結果を達成しました。成功に後押しされて、検索効率と検出精度の両方を大幅に向上させる、新しいワンショットパス集約ネットワークアーキテクチャ検索(OPANAS)アルゴリズムを提案します。具体的には、最初に6つの異種情報パスを導入して、検索スペースを構築します。つまり、トップダウン、ボトムアップ、融合分割、スケールイコライジング、スキップ接続などです。次に、FPNの新しい検索空間を提案します。ここでは、各FPN候補が密に接続された有向非巡回グラフで表されます(各ノードは特徴ピラミッドであり、各エッジは6つの異種情報パスの1つです)。第三に、最適なパス集約アーキテクチャを見つけるための効率的なワンショット検索方法を提案します。つまり、最初にスーパーネットをトレーニングし、次に進化的アルゴリズムを使用して最適な候補を見つけます。実験結果は、オブジェクト検出のための提案されたOPANASの有効性を示しています。(1)OPANASは、最先端の方法(NAS-FPNやAuto-FPNなど)よりも効率的で、検索コストが大幅に低くなっています(たとえば、 MS-COCOで4GPU日); (2)OPANASによって検出された最適なアーキテクチャは、RetinaNet、Faster R-CNN、Cascade R-CNNなどの主流の検出器をFPNの対応するものと比較して2.3〜3.2%mAP大幅に改善します。 (3)同等の最先端技術よりも少ないトレーニングコストで、新しい最先端の精度と速度のトレードオフ(7.6 FPSで52.2%mAP)。コードはhttps://github.com/VDIGPKU/OPANASでリリースされます。
Recently, neural architecture search (NAS) has been exploited to design feature pyramid networks (FPNs) and achieved promising results for visual object detection. Encouraged by the success, we propose a novel One-Shot Path Aggregation Network Architecture Search (OPANAS) algorithm, which significantly improves both searching efficiency and detection accuracy. Specifically, we first introduce six heterogeneous information paths to build our search space, namely top-down, bottom-up, fusing-splitting, scale-equalizing, skip-connect and none. Second, we propose a novel search space of FPNs, in which each FPN candidate is represented by a densely-connected directed acyclic graph (each node is a feature pyramid and each edge is one of the six heterogeneous information paths). Third, we propose an efficient one-shot search method to find the optimal path aggregation architecture, that is, we first train a super-net and then find the optimal candidate with an evolutionary algorithm. Experimental results demonstrate the efficacy of the proposed OPANAS for object detection: (1) OPANAS is more efficient than state-of-the-art methods (e.g., NAS-FPN and Auto-FPN), at significantly smaller searching cost (e.g., only 4 GPU days on MS-COCO); (2) the optimal architecture found by OPANAS significantly improves main-stream detectors including RetinaNet, Faster R-CNN and Cascade R-CNN, by 2.3-3.2 % mAP comparing to their FPN counterparts; and (3) a new state-of-the-art accuracy-speed trade-off (52.2 % mAP at 7.6 FPS) at smaller training costs than comparable state-of-the-arts. Code will be released at https://github.com/VDIGPKU/OPANAS.