arXiv reaDer
クラスの不均衡を伴う少数のショット学習
Few-Shot Learning with Class Imbalance
少数ショット学習は、クエリセットからの見えないサンプルに一般化するために、サポートセットで指定された限られた数のラベル付きサンプルでモデルをトレーニングすることを目的としています。標準設定では、サポートセットにはクラスごとに同量のデータポイントが含まれています。ただし、この仮定は、クラスの不均衡など、現実世界の動的な性質から生じる多くの実際的な考慮事項を見落としています。このホワイトペーパーでは、メタデータセットとタスクの不均衡、さまざまな不均衡分布(線形、ステップ、ランダム)の影響、およびリバランス手法の影響という3つの軸に沿った数ショットのクラス不均衡の詳細な調査を示します。不均衡なタスクとメタデータセットを使用して、10を超える最先端の数ショット学習とメタ学習の方法を広範囲に比較します。 Mini-ImageNetを使用した分析では、1)バランスの取れたタスクと比較して、クラス不均衡のタスクのパフォーマンスは常に低下し、最適化ベースのメソッドでは最大18.0%、メトリックベースのメソッドでは最大8.4%低下します。2)一般的な考えに反して、MAMLなどのメタ学習アルゴリズムは、(メタ)トレーニング時間中に不均衡なタスクにさらされることによって自動的にバランスをとることを学習しません。3)オーバーサンプリングなどの教師あり学習の不均衡を緩和するために使用される戦略は、クラスの不均衡の問題に対してより強力な解決策を提供します。4)メタデータセットレベルでの不均衡の影響は、同様の不均衡の大きさを持つタスクレベルでの影響よりも重要ではありません。実験を再現するためのコードは、オープンソースライセンスの下でリリースされています。
Few-shot learning aims to train models on a limited number of labeled samples given in a support set in order to generalize to unseen samples from a query set. In the standard setup, the support set contains an equal amount of data points for each class. However, this assumption overlooks many practical considerations arising from the dynamic nature of the real world, such as class-imbalance. In this paper, we present a detailed study of few-shot class-imbalance along three axes: meta-dataset vs. task imbalance, effect of different imbalance distributions (linear, step, random), and effect of rebalancing techniques. We extensively compare over 10 state-of-the-art few-shot learning and meta-learning methods using unbalanced tasks and meta-datasets. Our analysis using Mini-ImageNet reveals that 1) compared to the balanced task, the performances on class-imbalance tasks counterparts always drop, by up to 18.0% for optimization-based methods, and up to 8.4 for metric-based methods, 2) contrary to popular belief, meta-learning algorithms, such as MAML, do not automatically learn to balance by being exposed to imbalanced tasks during (meta-)training time, 3) strategies used to mitigate imbalance in supervised learning, such as oversampling, can offer a stronger solution to the class imbalance problem, 4) the effect of imbalance at the meta-dataset level is less significant than the effect at the task level with similar imbalance magnitude. The code to reproduce the experiments is released under an open-source license.
updated: Thu Jan 07 2021 12:54:32 GMT+0000 (UTC)
published: Thu Jan 07 2021 12:54:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト