arXiv reaDer
Contextual Gradient Scaling for Few-Shot Learning
モデルにとらわれないメタ学習(MAML)は、よく知られている最適化ベースのメタ学習アルゴリズムであり、数ショットの分類など、さまざまなコンピュータービジョンタスクでうまく機能します。 MAMLは、モデルが数ステップで新しいタスクに適応できるように、初期化を学習することです。ただし、分類器(ヘッド)の勾配ノルムはバックボーン層の勾配ノルムよりもはるかに大きいため、モデルは、同様の表現で分類器の決定境界を学習することに焦点を当てています。さらに、高レベル層の勾配基準は他の層の勾配基準よりも小さい。そのため、MAMLのバックボーンは通常、タスク全般の機能を学習します。その結果、内部ループでの適応パフォーマンスが低下します。この問題を解決または軽減するために、バックボーンの勾配ノルムをスケーリングして内部ループでのタスク固有の知識の学習を容易にするコンテキスト勾配スケーリング(CxGrad)を提案します。スケーリング係数はタスク条件付きパラメーターから生成されるため、バックボーンの勾配ノルムをタスクごとにスケーリングできます。実験結果は、CxGradがバックボーンに内部ループでタスク固有の知識を学習するように効果的に促し、同じドメインとクロスドメインの両方の少数ショット分類でMAMLのパフォーマンスを大幅に向上させることを示しています。
Model-agnostic meta-learning (MAML) is a well-known optimization-based meta-learning algorithm that works well in various computer vision tasks, e.g., few-shot classification. MAML is to learn an initialization so that a model can adapt to a new task in a few steps. However, since the gradient norm of a classifier (head) is much bigger than those of backbone layers, the model focuses on learning the decision boundary of the classifier with similar representations. Furthermore, gradient norms of high-level layers are small than those of the other layers. So, the backbone of MAML usually learns task-generic features, which results in deteriorated adaptation performance in the inner-loop. To resolve or mitigate this problem, we propose contextual gradient scaling (CxGrad), which scales gradient norms of the backbone to facilitate learning task-specific knowledge in the inner-loop. Since the scaling factors are generated from task-conditioned parameters, gradient norms of the backbone can be scaled in a task-wise fashion. Experimental results show that CxGrad effectively encourages the backbone to learn task-specific knowledge in the inner-loop and improves the performance of MAML up to a significant margin in both same- and cross-domain few-shot classification.
updated: Wed Oct 20 2021 03:05:58 GMT+0000 (UTC)
published: Wed Oct 20 2021 03:05:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト