クロスドメイン フューズ ショット メタ学習 (CDFSML) は、複数のソース ドメインからインスタンスの少ないターゲット ドメインに、明確に異なる分布を持つ知識を転送する必要がある学習の問題に対処します。最近公開された CDFSML メソッドは一般に、複数のソース ドメインの知識を 1 つのバックボーン特徴抽出器に結合する「ユニバーサル モデル」を構築します。これにより効率的な推論が可能になりますが、新しいソース ドメインが追加されるたびにバックボーンの再計算が必要になります。さらに、これらのメソッドは、多くの場合、バックボーンのコレクション (通常はソース ドメインごとに 1 つ) からユニバーサル モデルを派生させます。これらのバックボーンは、ユニバーサル モデルと同じアーキテクチャを持つように制約されています。バックボーンのアーキテクチャに制約を課さず、新しいソースドメインのバックボーンが利用可能になったときにユニバーサルモデルを再計算する必要がない、バックボーンのコレクションからの情報を結合するための新しい CDFSML メソッドである特徴抽出スタッキング (FES) を提案します。 .メタ学習への古典的なスタッキング アプローチに触発された基本的な FES アルゴリズムを提示し、畳み込み FES (ConFES) と正則化 FES (ReFES) の 2 つのバリアントも紹介します。ターゲット ドメイン タスクが与えられると、これらのアルゴリズムは各バックボーンを個別に微調整し、交差検証を使用して、タスクで利用可能なサポート セットからメタ トレーニング データを抽出し、このデータから単純な線形メタ分類子を学習します。有名な Meta-Dataset ベンチマークで FES メソッドを評価し、畳み込みニューラル ネットワークを使用した画像分類をターゲットにして、最先端のパフォーマンスを達成できることを示します。
Cross-domain few-shot meta-learning (CDFSML) addresses learning problems where knowledge needs to be transferred from several source domains into an instance-scarce target domain with an explicitly different distribution. Recently published CDFSML methods generally construct a "universal model" that combines knowledge of multiple source domains into one backbone feature extractor. This enables efficient inference but necessitates re-computation of the backbone whenever a new source domain is added. Moreover, these methods often derive their universal model from a collection of backbones -- normally one for each source domain -- where these backbones are constrained to have the same architecture as the universal model. We propose feature extractor stacking (FES), a new CDFSML method for combining information from a collection of backbones that imposes no constraints on the backbones' architecture and does not require re-computing a universal model when a backbone for a new source domain becomes available. We present the basic FES algorithm, which is inspired by the classic stacking approach to meta-learning, and also introduce two variants: convolutional FES (ConFES) and regularised FES (ReFES). Given a target-domain task, these algorithms fine-tune each backbone independently, use cross-validation to extract meta training data from the support set available for the task, and learn a simple linear meta-classifier from this data. We evaluate our FES methods on the well-known Meta-Dataset benchmark, targeting image classification with convolutional neural networks, and show that they can achieve state-of-the-art performance.