arXiv reaDer
少数ショット画像認識におけるデータセットバイアス
Dataset Bias in Few-shot Image Recognition
少数ショット画像認識(FSIR)の目的は、トレーニングデータ(基本カテゴリ)からの転送可能な知識を活用して、注釈付きサンプルの数が少ない新規カテゴリを識別することです。現在のほとんどの研究は、伝達可能な知識が新しいカテゴリーを識別するためにうまく使用できると想定しています。ただし、このような転送可能な機能はデータセットのバイアスの影響を受ける可能性があり、この問題が以前に調査されることはほとんどありません。さらに、ほとんどの少数ショット学習法は異なるデータセットに偏っています。これもまた、深く調査する必要がある重要な問題です。このホワイトペーパーでは、まず、ベースカテゴリから学習した転送可能な機能の影響を調査します。具体的には、関連性を使用して、基本カテゴリと小説カテゴリ間の関係を測定します。基本カテゴリの分布は、インスタンス密度とカテゴリの多様性を介して示されます。 FSIRモデルは、関連するトレーニングデータから、より伝達可能な知識を学習します。関連データでは、密度の高いインスタンスまたは多様なカテゴリにより、学習した知識をさらに充実させることができます。 ImagNetのさまざまなサブデータセットの実験結果は、カテゴリの関連性、インスタンス密度、およびカテゴリの多様性が、ベースカテゴリからの転送可能なバイアスを示していることを示しています。第二に、データセット構造の異なるデータセットと異なる少数ショット学習法のパフォーマンスの違いを調査します。具体的には、データセット構造の特性を定量化するために、画像の複雑さ、概念内の視覚的な一貫性、概念間の視覚的な類似性を紹介します。これらの定量的特性と4つの少数ショット学習法を使用して、5つの異なるデータセットのパフォーマンスの違いを分析します。実験分析に基づいて、データセット構造と少数ショット学習法の両方の観点からいくつかの洞察に満ちた観察が得られます。これらの観察が将来のFSIR研究の指針となることを願っています。
The goal of few-shot image recognition (FSIR) is to identify novel categories with a small number of annotated samples by exploiting transferable knowledge from training data (base categories). Most current studies assume that the transferable knowledge can be well used to identify novel categories. However, such transferable capability may be impacted by the dataset bias, and this problem has rarely been investigated before. Besides, most of few-shot learning methods are biased to different datasets, which is also an important issue that needs to be investigated deeply. In this paper, we first investigate the impact of transferable capabilities learned from base categories. Specifically, we use the relevance to measure relationships between base categories and novel categories. Distributions of base categories are depicted via the instance density and category diversity. The FSIR model learns better transferable knowledge from relevant training data. In the relevant data, dense instances or diverse categories can further enrich the learned knowledge. Experimental results on different sub-datasets of ImagNet demonstrate category relevance, instance density and category diversity can depict transferable bias from base categories. Second, we investigate performance differences on different datasets from dataset structures and different few-shot learning methods. Specifically, we introduce image complexity, intra-concept visual consistency, and inter-concept visual similarity to quantify characteristics of dataset structures. We use these quantitative characteristics and four few-shot learning methods to analyze performance differences on five different datasets. Based on the experimental analysis, some insightful observations are obtained from the perspective of both dataset structures and few-shot learning methods. We hope these observations are useful to guide future FSIR research.
updated: Tue Mar 16 2021 03:23:18 GMT+0000 (UTC)
published: Tue Aug 18 2020 14:46:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト