arXiv reaDer
必要なのは SuSana Distancia だけです: 少数ショット画像分類のための 2 つの新しい距離ベースの損失関数により、計量学習におけるクラス分離性を強化します
SuSana Distancia is all you need: Enforcing class separability in metric learning via two novel distance-based loss functions for few-shot image classification
フューショット学習は、わずか数個のラベル付きデータサンプルを使用して新しい概念を学習することを目的とした、挑戦的な研究分野です。メトリクス学習アプローチに基づく最近の研究では、メタ学習アプローチを活用しています。メタ学習アプローチは、サポート (トレーニング) とクエリ セット (テスト) を使用するエピソード タスクに含まれており、これらのセット間の類似性比較メトリクスを学習することを目的としています。データが不足しているため、埋め込みネットワークの学習プロセスは、少数ショット タスクの重要な部分になります。これまでの研究では、計量学習アプローチを使用してこの問題に対処していましたが、基礎となる潜在空間の特性とその上の差クラスの分離可能性は完全には強制されていませんでした。この研究では、少数のデータ間のクラス内およびクラス間の距離を調べることによって埋め込みベクトルの重要性を考慮する 2 つの異なる損失関数を提案します。最初の損失関数はプロトトリプレット損失で、これは元のトリプレット損失に基づいており、ショット数が少ないシナリオでより適切に機能するために必要な修正が加えられています。 ICNN 損失と呼ぶ 2 番目の損失関数は、クラス間およびクラス内の最近傍スコアに基づいており、トレーニングされたネットワークから取得された埋め込みの品質を評価するのに役立ちます。広範な実験設定から得られた結果は、他のメトリックベースの少数ショット学習方法と比較して、miniImagenNet ベンチマークの精度が 2% マージンで大幅に向上していることを示しており、これらの損失関数がネットワークを一般化できることを示しています。以前に見たことのないクラスの方が優れています。私たちの実験では、Caltech CUB、Dogs、Cars データセットなどの他のドメインに対する競争力のある一般化機能を最先端技術と比較して実証します。
Few-shot learning is a challenging area of research that aims to learn new concepts with only a few labeled samples of data. Recent works based on metric-learning approaches leverage the meta-learning approach, which is encompassed by episodic tasks that make use a support (training) and query set (test) with the objective of learning a similarity comparison metric between those sets. Due to the lack of data, the learning process of the embedding network becomes an important part of the few-shot task. Previous works have addressed this problem using metric learning approaches, but the properties of the underlying latent space and the separability of the difference classes on it was not entirely enforced. In this work, we propose two different loss functions which consider the importance of the embedding vectors by looking at the intra-class and inter-class distance between the few data. The first loss function is the Proto-Triplet Loss, which is based on the original triplet loss with the modifications needed to better work on few-shot scenarios. The second loss function, which we dub ICNN loss is based on an inter and intra class nearest neighbors score, which help us to assess the quality of embeddings obtained from the trained network. Our results, obtained from a extensive experimental setup show a significant improvement in accuracy in the miniImagenNet benchmark compared to other metric-based few-shot learning methods by a margin of 2%, demonstrating the capability of these loss functions to allow the network to generalize better to previously unseen classes. In our experiments, we demonstrate competitive generalization capabilities to other domains, such as the Caltech CUB, Dogs and Cars datasets compared with the state of the art.
updated: Mon May 15 2023 23:12:09 GMT+0000 (UTC)
published: Mon May 15 2023 23:12:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト