ニューラルアーキテクチャ検索、プルーニング、ナレッジ蒸留の3つの主要コンポーネントを統合する、オブジェクト検出用の統合NASフレームワークであるJoint-DetNASを提案します。これらの手法を単純にパイプライン化する代わりに、Joint-DetNASはそれらを共同で最適化します。アルゴリズムは2つのコアプロセスで構成されています。学生の射は学生のアーキテクチャを最適化し、冗長なパラメータを削除しますが、動的蒸留は最適な一致する教師を見つけることを目的としています。学生の射については、重み継承戦略が採用されており、前任者の重みを十分に活用しながら、学生がアーキテクチャを柔軟に更新できるようにすることで、検索が大幅に高速化されます。動的蒸留を容易にするために、統合された漸進的縮小戦略を介して弾性教師プールがトレーニングされ、その後の検索で追加コストなしで教師検出器をサンプリングできます。基本検出器を入力として指定すると、アルゴリズムは、追加のトレーニングなしで、導出された学生検出器を高性能で直接出力します。実験は、Joint-DetNASがナイーブなパイプラインアプローチを大幅に上回っていることを示しています。ベース検出器として従来のR101-FPNを使用すると、Joint-DetNASはMS COCOでmAPを41.4から43.9にブーストし、レイテンシを47%削減できます。これは、SOTA EfficientDetと同等であり、必要な検索コストも少なくて済みます。提案された方法が、NAS、KD、および剪定を共同で最適化する新しい方法をコミュニティに提供できることを願っています。
We propose Joint-DetNAS, a unified NAS framework for object detection, which integrates 3 key components: Neural Architecture Search, pruning, and Knowledge Distillation. Instead of naively pipelining these techniques, our Joint-DetNAS optimizes them jointly. The algorithm consists of two core processes: student morphism optimizes the student's architecture and removes the redundant parameters, while dynamic distillation aims to find the optimal matching teacher. For student morphism, weight inheritance strategy is adopted, allowing the student to flexibly update its architecture while fully utilize the predecessor's weights, which considerably accelerates the search; To facilitate dynamic distillation, an elastic teacher pool is trained via integrated progressive shrinking strategy, from which teacher detectors can be sampled without additional cost in subsequent searches. Given a base detector as the input, our algorithm directly outputs the derived student detector with high performance without additional training. Experiments demonstrate that our Joint-DetNAS outperforms the naive pipelining approach by a great margin. Given a classic R101-FPN as the base detector, Joint-DetNAS is able to boost its mAP from 41.4 to 43.9 on MS COCO and reduce the latency by 47%, which is on par with the SOTA EfficientDet while requiring less search cost. We hope our proposed method can provide the community with a new way of jointly optimizing NAS, KD and pruning.