arXiv reaDer
適応ハイパーパラメータを使用したメタ学習
Meta-Learning with Adaptive Hyperparameters
その人気にもかかわらず、いくつかの最近の研究は、テストタスクがトレーニングタスクと異なる場合のMAMLの有効性に疑問を投げかけ、したがって、初期化を改善するためのさまざまなタスク条件付き方法論を示唆しています。より優れたタスク対応の初期化を探す代わりに、MAMLフレームワークの補完的な要素である内部ループ最適化(または高速適応)に焦点を当てます。したがって、高速適応プロセスを大幅に強化する新しい重み更新ルールを提案します。具体的には、ステップごとのハイパーパラメータ(学習率と重み減衰係数)を適応的に生成できる小さなメタネットワークを紹介します。実験結果は、高速適応のためのハイパーパラメータのアダプティブラーニング(ALFA)が、最近の数ショット学習アプローチではしばしば無視されていた同様に重要な要素であることを検証しています。驚いたことに、ALFAを使用したランダムな初期化からの高速な適応は、すでにMAMLを上回っています。
Despite its popularity, several recent works question the effectiveness of MAML when test tasks are different from training tasks, thus suggesting various task-conditioned methodology to improve the initialization. Instead of searching for better task-aware initialization, we focus on a complementary factor in MAML framework, inner-loop optimization (or fast adaptation). Consequently, we propose a new weight update rule that greatly enhances the fast adaptation process. Specifically, we introduce a small meta-network that can adaptively generate per-step hyperparameters: learning rate and weight decay coefficients. The experimental results validate that the Adaptive Learning of hyperparameters for Fast Adaptation (ALFA) is the equally important ingredient that was often neglected in the recent few-shot learning approaches. Surprisingly, fast adaptation from random initialization with ALFA can already outperform MAML.
updated: Tue Dec 08 2020 06:53:01 GMT+0000 (UTC)
published: Sat Oct 31 2020 08:05:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト