少数ショットオブジェクト検出(FSOD)は、少数のデータサンプルのみが与えられた場合に、画像内のオブジェクトをローカライズおよび分類します。 FSOD研究の最近の傾向は、壊滅的な忘却とクラスの混乱を招きやすいメトリックとメタ学習技術の採用を示しています。メトリック学習ベースのFSOD手法におけるこれらの落とし穴を克服するために、オブジェクト検出器の分類ヘッドで、より緊密で十分に分離されたクラス固有の特徴クラスターの作成を容易にする注意ガイド余弦マージン(AGCM)を導入します。私たちの新しい注意深い提案融合(APF)モジュールは、同時発生するクラス間のクラス内分散を減らすことにより、壊滅的な忘却を最小限に抑えます。同時に、提案された余弦マージンクロスエントロピー損失は、混乱しているクラス間の角度マージンを増加させ、すでに学習された(基本)クラスと新しく追加された(新しい)クラスの間のクラス混乱の課題を克服します。私たちは、人気のあるFSODベンチマークPASCAL-VOCとともに、実際のクラスの不均衡な設定を提示する、挑戦的なインドの運転データセット(IDD)で実験を行います。私たちの方法は、最新の(SoTA)アプローチよりも、IDD-OSで最大6.4 mAPポイント、IDD-10スプリットで最大2.0mAPポイントの10ショット設定を上回っています。 PASCAL-VOCデータセットでは、既存のSoTAアプローチを最大4.9mAPポイント上回っています。
Few-shot object detection (FSOD) localizes and classifies objects in an image given only a few data samples. Recent trends in FSOD research show the adoption of metric and meta-learning techniques, which are prone to catastrophic forgetting and class confusion. To overcome these pitfalls in metric learning based FSOD techniques, we introduce Attention Guided Cosine Margin (AGCM) that facilitates the creation of tighter and well separated class-specific feature clusters in the classification head of the object detector. Our novel Attentive Proposal Fusion (APF) module minimizes catastrophic forgetting by reducing the intra-class variance among co-occurring classes. At the same time, the proposed Cosine Margin Cross-Entropy loss increases the angular margin between confusing classes to overcome the challenge of class confusion between already learned (base) and newly added (novel) classes. We conduct our experiments on the challenging India Driving Dataset (IDD), which presents a real-world class-imbalanced setting alongside popular FSOD benchmark PASCAL-VOC. Our method outperforms State-of-the-Art (SoTA) approaches by up to 6.4 mAP points on the IDD-OS and up to 2.0 mAP points on the IDD-10 splits for the 10-shot setting. On the PASCAL-VOC dataset, we outperform existing SoTA approaches by up to 4.9 mAP points.