少数のトレーニングサンプルで目に見えないタスクに適応できる一般的な検出器を学習することを目的とした少数ショットオブジェクト検出(FSOD)は、最近一貫した改善を目撃しています。ただし、ほとんどの既存の方法は、効率の問題を無視します。たとえば、計算の複雑さが高く、適応速度が遅いなどです。特に、組み込みAIへの新たな傾向により、効率は少数ショット手法のますます重要な評価指標になっています。この目的のために、計算増分のない効率的なpretrain-transferフレームワーク(PTF)ベースラインを提示します。これにより、以前の最先端(SOTA)メソッドと同等の結果が得られます。このベースラインに基づいて、知識継承(KI)という名前の初期化子を考案して、ボックス分類器の新しい重みを確実に初期化します。これにより、知識の転送プロセスが効果的に促進され、適応速度が向上します。 KI初期化子内で、予測された新規の重みと事前にトレーニングされた基本重みの間のベクトル長の不一致を軽減するための適応長再スケーリング(ALR)戦略を提案します。最後に、私たちのアプローチは、PASCAL VOC、COCO、LVISの3つの公開ベンチマークでSOTAの結果を達成するだけでなく、数回のショットでCOCO / LVISベンチマークの他の方法に比べて1.8〜9.0倍速い適応速度で高い効率を示します移行。私たちの知る限り、これはFSODの効率の問題を検討する最初の作業です。私たちは、強力でありながら効率的な数ショットの技術開発へのトレンドを動機付けたいと考えています。コードはhttps://github.com/Ze-Yang/Efficient-FSODで公開されています。
Few-shot object detection (FSOD), which aims at learning a generic detector that can adapt to unseen tasks with scarce training samples, has witnessed consistent improvement recently. However, most existing methods ignore the efficiency issues, e.g., high computational complexity and slow adaptation speed. Notably, efficiency has become an increasingly important evaluation metric for few-shot techniques due to an emerging trend toward embedded AI. To this end, we present an efficient pretrain-transfer framework (PTF) baseline with no computational increment, which achieves comparable results with previous state-of-the-art (SOTA) methods. Upon this baseline, we devise an initializer named knowledge inheritance (KI) to reliably initialize the novel weights for the box classifier, which effectively facilitates the knowledge transfer process and boosts the adaptation speed. Within the KI initializer, we propose an adaptive length re-scaling (ALR) strategy to alleviate the vector length inconsistency between the predicted novel weights and the pretrained base weights. Finally, our approach not only achieves the SOTA results across three public benchmarks, i.e., PASCAL VOC, COCO and LVIS, but also exhibits high efficiency with 1.8-9.0x faster adaptation speed against the other methods on COCO/LVIS benchmark during few-shot transfer. To our best knowledge, this is the first work to consider the efficiency problem in FSOD. We hope to motivate a trend toward powerful yet efficient few-shot technique development. The codes are publicly available at https://github.com/Ze-Yang/Efficient-FSOD.