近年、少数ショットの物体検出が注目を集め、急速に進歩しています。ただし、既存の方法で徹底的なオフライン微調整段階を必要とすることは時間がかかり、低電力ロボットの自律探査などのオンラインアプリケーションでの使用を大幅に妨げます。彼らの主な制限は、いくつかのサポート画像からのわずかではあるが価値のある情報が十分に活用されていないことです。この問題を解決するために、まったく新しいアーキテクチャであるAirDetを提案します。驚くべきことに、クロススケールオブジェクト提案ネットワーク、ショット集約モジュール、ローカリゼーションネットワーク、AirDetを含むすべてのモジュールで、サポート画像とのクラスにとらわれない関係を学習することで、微調整を行わないと、多くの微調整された方法と同等またはそれ以上の結果が得られ、最大30〜40%の改善に達します。また、ロボット工学におけるAirDetの実現可能性を強力に検証する、DARPASubterraneanChallengeからの実際の探査データに対するオンボードテストの確かな結果を示します。私たちの知る限り、AirDetは、低出力ロボットの自律探査のための最初の実行可能な数ショット検出方法です。コードと事前トレーニング済みモデルは、https://github.com/Jaraxxus-Me/AirDetでリリースされています。
Few-shot object detection has attracted increasing attention and rapidly progressed in recent years. However, the requirement of an exhaustive offline fine-tuning stage in existing methods is time-consuming and significantly hinders their usage in online applications such as autonomous exploration of low-power robots. We find that their major limitation is that the little but valuable information from a few support images is not fully exploited. To solve this problem, we propose a brand new architecture, AirDet, and surprisingly find that, by learning class-agnostic relation with the support images in all modules, including cross-scale object proposal network, shots aggregation module, and localization network, AirDet without fine-tuning achieves comparable or even better results than many fine-tuned methods, reaching up to 30-40% improvements. We also present solid results of onboard tests on real-world exploration data from the DARPA Subterranean Challenge, which strongly validate the feasibility of AirDet in robotics. To the best of our knowledge, AirDet is the first feasible few-shot detection method for autonomous exploration of low-power robots. The code and pre-trained models are released at https://github.com/Jaraxxus-Me/AirDet.