arXiv reaDer
依存関係の最大化とインスタンス判別分析による数ショットの学習
Few-shot Learning via Dependency Maximization and Instance Discriminant Analysis
数ショット学習(FSL)問題を研究します。この問題では、モデルは、カテゴリごとにラベル付けされたトレーニングデータが非常に少ない新しいオブジェクトの認識を学習します。以前のFSLアプローチのほとんどは、メタ学習パラダイムに頼っています。メタ学習パラダイムでは、モデルは、新しい目に見えない数ショットのタスクを解決するために、多くのトレーニングタスクを学習することで誘導バイアスを蓄積します。対照的に、数ショットのパフォーマンスを向上させるために、数ショットのタスクに伴うラベルのないデータを活用する簡単なアプローチを提案します。まず、相互共分散演算子のヒルベルトシュミットノルムに基づく依存性最大化手法を提案します。これは、これらのラベルなしデータの埋め込み特徴とラベル予測の間の統計的依存性を、サポートセットに対する教師あり損失とともに最大化します。次に、取得したモデルを使用して、これらのラベルなしデータの疑似ラベルを推測します。さらに、最初のステップのように、各疑似ラベル付きの例の信頼性を評価し、最も忠実な例を拡張サポートセットに選択してモデルを再トレーニングするために、インスタンス判別分析を提案します。ラベルなしデータの疑似ラベルが安定するまで、上記のプロセスを繰り返します。標準のトランスダクティブおよび半教師ありFSL設定に従って、私たちの実験は、提案された方法が、mini-ImageNet、tiered-ImageNet、CUB、およびCIFARFSを含む4つの広く使用されているベンチマークで以前の最先端の方法よりも優れていることを示しています。
We study the few-shot learning (FSL) problem, where a model learns to recognize new objects with extremely few labeled training data per category. Most of previous FSL approaches resort to the meta-learning paradigm, where the model accumulates inductive bias through learning many training tasks so as to solve a new unseen few-shot task. In contrast, we propose a simple approach to exploit unlabeled data accompanying the few-shot task for improving few-shot performance. Firstly, we propose a Dependency Maximization method based on the Hilbert-Schmidt norm of the cross-covariance operator, which maximizes the statistical dependency between the embedded feature of those unlabeled data and their label predictions, together with the supervised loss over the support set. We then use the obtained model to infer the pseudo-labels for those unlabeled data. Furthermore, we propose anInstance Discriminant Analysis to evaluate the credibility of each pseudo-labeled example and select the most faithful ones into an augmented support set to retrain the model as in the first step. We iterate the above process until the pseudo-labels for the unlabeled data becomes stable. Following the standard transductive and semi-supervised FSL setting, our experiments show that the proposed method out-performs previous state-of-the-art methods on four widely used benchmarks, including mini-ImageNet, tiered-ImageNet, CUB, and CIFARFS.
updated: Tue Sep 07 2021 02:19:01 GMT+0000 (UTC)
published: Tue Sep 07 2021 02:19:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト