arXiv reaDer
少数のショットオブジェクト検出のためのユニバーサルプロトタイプ拡張
Universal-Prototype Augmentation for Few-Shot Object Detection
少数ショットオブジェクト検出(FSOD)は、ラベル付けされたサンプルが少ない新しいオブジェクト検出のパフォーマンスを強化することを目的としています。少数のサンプルの制約を緩和するには、新しいオブジェクトの学習された特徴の一般化能力を強化することが重要な役割を果たします。したがって、FSODの特徴学習プロセスは、さまざまな視覚的変化の下で不変であり、したがって特徴の一般化に役立つ固有のオブジェクト特性にさらに焦点を当てる必要があります。メタ学習パラダイムのこれまでの試みとは異なり、このペーパーでは、さまざまなオブジェクトカテゴリに共通する固有の特性を持つオブジェクト機能を平滑化する方法を探ります。すべてのオブジェクトカテゴリから学習した新しいプロトタイプ、つまりユニバーサルプロトタイプを提案します。不変の特性を特徴付ける利点に加えて、ユニバーサルプロトタイプは、不均衡なオブジェクトカテゴリの影響を軽減します。ユニバーサルプロトタイプを使用してオブジェクト機能を拡張した後、一貫性の損失を課して、拡張機能と元の機能の間の一致を最大化します。これは、不変のオブジェクト特性の学習に役立ちます。したがって、新しいオブジェクトに対する機能の一般化のメリットを備えたユニバーサルプロトタイプ(FSOD ^ up)を使用して、数ショットのオブジェクト検出の新しいフレームワークを開発します。 PASCALVOCとMSCOCOの実験結果は、FSOD ^ upの有効性を示しています。特に、VOC Split2のワンショットの場合、FSOD ^ upはmAPに関してベースラインを6.8%上回っています。さらに、ロングテール検出データセット、つまりLVISでFSOD ^ upをさらに検証します。また、FSOD ^ upを採用することは、最先端の方法よりも優れています。
Few-shot object detection (FSOD) aims to strengthen the performance of novel object detection with few labeled samples. To alleviate the constraint of few samples, enhancing the generalization ability of learned features for novel objects plays a key role. Thus, the feature learning process of FSOD should focus more on intrinsical object characteristics, which are invariant under different visual changes and therefore are helpful for feature generalization. Unlike previous attempts of the meta-learning paradigm, in this paper, we explore how to smooth object features with intrinsical characteristics that are universal across different object categories. We propose a new prototype, namely universal prototype, that is learned from all object categories. Besides the advantage of characterizing invariant characteristics, the universal prototypes alleviate the impact of unbalanced object categories. After augmenting object features with the universal prototypes, we impose a consistency loss to maximize the agreement between the augmented features and the original one, which is beneficial for learning invariant object characteristics. Thus, we develop a new framework of few-shot object detection with universal prototypes (FSOD^up) that owns the merit of feature generalization towards novel objects. Experimental results on PASCAL VOC and MS COCO demonstrate the effectiveness of FSOD^up. Particularly, for the 1-shot case of VOC Split2, FSOD^up outperforms the baseline by 6.8% in terms of mAP. Moreover, we further verify FSOD^up on a long-tail detection dataset, i.e., LVIS. And employing FSOD^up outperforms the state-of-the-art method.
updated: Mon Mar 01 2021 15:35:36 GMT+0000 (UTC)
published: Mon Mar 01 2021 15:35:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト