arXiv reaDer
関係を比較する学習:数回のショット学習のためのセマンティックアライメント
Learning to Compare Relation: Semantic Alignment for Few-Shot Learning
 少数ショットの学習は、ほんの数例から新しいカテゴリを認識する必要があるため、基本的かつ挑戦的な問題です。認識用のオブジェクトには複数のバリアントがあり、画像内のどこにでも配置できます。クエリ画像とサンプル画像を直接比較することは、コンテンツのずれを処理できません。比較のための表現とメトリックは重要ですが、少数ショット学習ではサンプルが不足しており、ばらつきが大きいため、学習が困難です。この論文では、コンテンツの不整合に対してロバストな関係を比較するための新しいセマンティック整合モデルを提示します。機能およびメトリックの学習能力を向上させるために、既存の少数ショット学習フレームワークに2つの重要な要素を追加することを提案します。最初に、セマンティックアライメント損失を導入して、同じカテゴリに属するサンプルのフィーチャのリレーション統計を調整します。次に、ローカルおよびグローバルな相互情報の最大化が導入され、画像内の構造的な場所全体でローカルに一貫したクラス内の共有情報を含む表現が可能になります。第三に、各ストリームのホモセダスティックな不確実性を考慮することにより、複数の損失関数を重み付けする原理的なアプローチを導入します。数ショットの学習データセットで広範な実験を行っています。実験結果は、提案された方法がセマンティックアライメント戦略との関係を比較でき、最先端のパフォーマンスを達成することを示しています。
Few-shot learning is a fundamental and challenging problem since it requires recognizing novel categories from only a few examples. The objects for recognition have multiple variants and can locate anywhere in images. Directly comparing query images with example images can not handle content misalignment. The representation and metric for comparison are critical but challenging to learn due to the scarcity and wide variation of the samples in few-shot learning. In this paper, we present a novel semantic alignment model to compare relations, which is robust to content misalignment. We propose to add two key ingredients to existing few-shot learning frameworks for better feature and metric learning ability. First, we introduce a semantic alignment loss to align the relation statistics of the features from samples that belong to the same category. And second, local and global mutual information maximization is introduced, allowing for representations that contain locally-consistent and intra-class shared information across structural locations in an image. Thirdly, we introduce a principled approach to weigh multiple loss functions by considering the homoscedastic uncertainty of each stream. We conduct extensive experiments on several few-shot learning datasets. Experimental results show that the proposed method is capable of comparing relations with semantic alignment strategies, and achieves state-of-the-art performance.
updated: Fri Jan 07 2022 08:52:31 GMT+0000 (UTC)
published: Sat Feb 29 2020 08:37:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト