arXiv reaDer
タスク固有のアダプターを使用したクロスドメインの少数ショット学習
Cross-domain Few-shot Learning with Task-specific Adapters
この論文では、これまでに見られなかったクラスと、ラベル付けされたサンプルがほとんどないドメインから分類器を学習することを目的とした、クロスドメインの数ショット分類の問題について説明します。最近のアプローチは、タスクにとらわれないタスク固有の重みで少数ショットの分類器をパラメーター化することによってこの問題を広く解決します。前者は通常、大きなトレーニングセットで学習され、後者は小さなサポートセットを条件とする補助ネットワークを通じて動的に予測されます。この作業では、後者の推定に焦点を当て、動的に推定するのではなく、小さなサポートセットでタスク固有の重みを最初から直接学習することを提案します。特に、体系的な分析を通じて、バックボーンネットワークの複数の中間層への残りの接続を備えたマトリックス形式のパラメトリックアダプターを介したタスク固有の重みが、メタデータセットの最先端モデルのパフォーマンスを大幅に向上させることを示します。わずかな追加コストでベンチマーク。
In this paper, we look at the problem of cross-domain few-shot classification that aims to learn a classifier from previously unseen classes and domains with few labeled samples. Recent approaches broadly solve this problem by parameterizing their few-shot classifiers with task-agnostic and task-specific weights where the former is typically learned on a large training set and the latter is dynamically predicted through an auxiliary network conditioned on a small support set. In this work, we focus on the estimation of the latter, and propose to learn task-specific weights from scratch directly on a small support set, in contrast to dynamically estimating them. In particular, through systematic analysis, we show that task-specific weights through parametric adapters in matrix form with residual connections to multiple intermediate layers of a backbone network significantly improves the performance of the state-of-the-art models in the Meta-Dataset benchmark with minor additional cost.
updated: Mon Nov 29 2021 17:22:09 GMT+0000 (UTC)
published: Thu Jul 01 2021 10:47:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト