arXiv reaDer
少数ショットのオブジェクト検出のためのトップ関連のメタ学習方法
Top-Related Meta-Learning Method for Few-Shot Object Detection
数ショットの検出のために、多くのメタ学習方法が提案されています。ただし、以前のほとんどの方法には、2つの主な問題があります。それは、APの検出が不十分であることと、データセットの不均衡と不十分さによる強いバイアスです。以前の作品は、主に追加のデータセット、複数の関係の注意メカニズム、およびサブモジュールによってこれらの問題を軽減します。ただし、より多くのコストが必要です。この作業では、メタ学習の場合、主な課題はカテゴリ間の関連または非関連のセマンティック機能に焦点を当てていることがわかります。したがって、セマンティック機能に基づいて、分類タスクのTop-C分類損失(つまり、TCL-C)と、メタモデルによって取得されたカテゴリベースのメタ機能のカテゴリベースのグループ化メカニズムを提案します。 TCL-Cは、真のラベル予測と最も可能性の高いC-1の誤った分類予測を利用して、少数のショットクラスでの検出パフォーマンスを向上させます。類似の外観(つまり、視覚的な外観、形状、手足など)とオブジェクトが頻繁に出現する環境に応じて、カテゴリベースのグループ化メカニズムはカテゴリを互いに素なグループに分割し、グループ内のカテゴリ間で類似のセマンティック機能をよりコンパクトにして取得します。グループ間のより重要な違い、強いバイアスの問題を軽減し、検出APをさらに改善します。トレーニング全体は、基本モデルと微調整フェーズで構成されます。グループ化メカニズムに従って、メタモデルによって取得されたメタ特徴ベクトルをグループ化することで、グループ間の分布の違いが明確になり、各グループ内の分布の違いが少なくなります。 Pascal VOCデータセットに関する広範な実験は、TCL-Cとカテゴリベースのグループ化を組み合わせた私たちの実験が、数ショットの検出のための以前の最先端の方法を大幅に上回っていることを示しています。以前の競合ベースラインと比較して、数ショット検出の検出APがほぼ4%向上しています。
Many meta-learning methods are proposed for few-shot detection. However, previous most methods have two main problems, poor detection APs, and strong bias because of imbalance and insufficient datasets. Previous works mainly alleviate these issues by additional datasets, multi-relation attention mechanisms and sub-modules. However, they require more cost. In this work, for meta-learning, we find that the main challenges focus on related or irrelevant semantic features between categories. Therefore, based on semantic features, we propose a Top-C classification loss (i.e., TCL-C) for classification task and a category-based grouping mechanism for category-based meta-features obtained by the meta-model. The TCL-C exploits the true-label prediction and the most likely C-1 false classification predictions to improve detection performance on few-shot classes. According to similar appearance (i.e., visual appearance, shape, and limbs etc.) and environment in which objects often appear, the category-based grouping mechanism splits categories into disjoint groups to make similar semantic features more compact between categories within a group and obtain more significant difference between groups, alleviating the strong bias problem and further improving detection APs. The whole training consists of the base model and the fine-tuning phases. According to grouping mechanism, we group the meta-features vectors obtained by meta-model, so that the distribution difference between groups is obvious, and the one within each group is less. Extensive experiments on Pascal VOC dataset demonstrate that ours which combines the TCL-C with category-based grouping significantly outperforms previous state-of-the-art methods for few-shot detection. Compared with previous competitive baseline, ours improves detection APs by almost 4% for few-shot detection.
updated: Tue Jun 15 2021 08:29:50 GMT+0000 (UTC)
published: Tue Jul 14 2020 05:52:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト