標準のクロスエントロピー損失でトレーニングされた深いネットワークを微調整することは、少数ショット学習の強力なベースラインです。トランスダクティブに微調整した場合、これは、同じハイパーパラメーターを備えたMini-ImageNet、Tiered-ImageNet、CIFAR-FS、FC-100などの標準データセットで現在の最先端技術よりも優れています。このアプローチのシンプルさにより、ImageNet-21kデータセットで最初の数ショットの学習結果を示すことができます。多数のメタトレーニングクラスを使用すると、多数の少数ショットクラスであっても、高い少数ショット精度が得られることがわかります。私たちのアプローチを少数ショット学習のソリューションとして提唱するのではなく、単にその結果を使用して、現在のベンチマークと少数ショットプロトコルの制限を強調します。ベンチマークデータセットに関する広範な研究を実施して、数発エピソードの「硬さ」を定量化するメトリックを提案します。このメトリックは、より体系的な方法で少数ショットアルゴリズムのパフォーマンスを報告するために使用できます。
Fine-tuning a deep network trained with the standard cross-entropy loss is a strong baseline for few-shot learning. When fine-tuned transductively, this outperforms the current state-of-the-art on standard datasets such as Mini-ImageNet, Tiered-ImageNet, CIFAR-FS and FC-100 with the same hyper-parameters. The simplicity of this approach enables us to demonstrate the first few-shot learning results on the ImageNet-21k dataset. We find that using a large number of meta-training classes results in high few-shot accuracies even for a large number of few-shot classes. We do not advocate our approach as the solution for few-shot learning, but simply use the results to highlight limitations of current benchmarks and few-shot protocols. We perform extensive studies on benchmark datasets to propose a metric that quantifies the "hardness" of a few-shot episode. This metric can be used to report the performance of few-shot algorithms in a more systematic way.