arXiv reaDer
BSNet:数ショットのきめ細かい画像分類のためのバイシミラリティネットワーク
BSNet: Bi-Similarity Network for Few-shot Fine-grained Image Classification
きめ細かい画像分類のための数ショット学習は、コンピュータビジョンで最近注目を集めています。数回の学習のためのアプローチの中で、単純さと有効性のために、メトリックベースの方法は多くのタスクで有利に最先端です。メトリックベースの方法のほとんどは、単一の類似性測度を想定しているため、単一の特徴空間を取得します。ただし、サンプルが2つの異なる類似性測度によって同時に適切に分類できる場合、クラス内のサンプルは、より小さな特徴空間でよりコンパクトに分散され、より識別力のある特徴マップを生成できます。これに動機付けられて、単一の埋め込みモジュールと2つの類似性尺度の二重類似性モジュールで構成されるいわゆるBi-Similarity Network(BSNet)を提案します。サポート画像とクエリ画像が畳み込みベースの埋め込みモジュールを通過した後、二重類似性モジュールは、多様な特性の2つの類似性尺度に従って特徴マップを学習します。このようにして、モデルは、モデルの一般化能力を大幅に向上させることができるように、きめの細かい画像のいくつかのショットから、より識別力があり、類似性に偏りの少ない特徴を学習することができます。確立されたメトリック/類似性ベースのネットワークをわずかに変更することによる広範な実験を通じて、提案されたアプローチがいくつかのきめの細かい画像ベンチマークデータセットに大幅な改善をもたらすことを示します。コードはhttps://github.com/spraise/BSNetで入手できます。
Few-shot learning for fine-grained image classification has gained recent attention in computer vision. Among the approaches for few-shot learning, due to the simplicity and effectiveness, metric-based methods are favorably state-of-the-art on many tasks. Most of the metric-based methods assume a single similarity measure and thus obtain a single feature space. However, if samples can simultaneously be well classified via two distinct similarity measures, the samples within a class can distribute more compactly in a smaller feature space, producing more discriminative feature maps. Motivated by this, we propose a so-called Bi-Similarity Network (BSNet) that consists of a single embedding module and a bi-similarity module of two similarity measures. After the support images and the query images pass through the convolution-based embedding module, the bi-similarity module learns feature maps according to two similarity measures of diverse characteristics. In this way, the model is enabled to learn more discriminative and less similarity-biased features from few shots of fine-grained images, such that the model generalization ability can be significantly improved. Through extensive experiments by slightly modifying established metric/similarity based networks, we show that the proposed approach produces a substantial improvement on several fine-grained image benchmark datasets. Codes are available at: https://github.com/spraise/BSNet
updated: Sun Nov 29 2020 08:38:17 GMT+0000 (UTC)
published: Sun Nov 29 2020 08:38:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト