arXiv reaDer
NDPNet:数ショットのきめ細かい画像分類のための新しい非線形データ投影ネットワーク
NDPNet: A novel non-linear data projection network for few-shot fine-grained image classification
メトリックベースの数ショットのきめ細かい画像分類(FSFGIC)は、非常に少数の例からクエリ画像とサポートクラスの間の類似性を推定することにより、転送可能な特徴埋め込みネットワークを学習することを目的としています。この作業では、数ショット学習の限られたサンプル問題に対処すると同時に、の識別可能性を高めるために、非線形データ投影の概念をFSFGICアーキテクチャの設計に初めて導入することを提案します。きめ細かい画像分類のモデル。具体的には、まず、効果的なメトリック学習に必要なセマンティック機能を取得するだけでなく、入力画像からより詳細にそのような機能を再強化する機能を備えた機能再抽象化埋め込みネットワークを設計します。次に、クエリ画像の記述子とサポートクラスが、提案された類似性メトリック学習ネットワーク内の異なる非線形空間に投影され、識別可能な投影係数を学習します。この設計は、同じクラス内のサンプル間の距離を小さくし、異なるクラスのサンプル間の距離を大きくし、異なるカテゴリのサンプル間の結合関係を減らすために、FSFGICタスクの困難で制限された条件で効果的に動作できます。さらに、提案された非線形データプロジェクトに基づく新しい類似性尺度が、クエリ画像とサポートセットとの間の特徴情報の関係を評価するために提示される。提案されたアーキテクチャは、エンドツーエンドのトレーニングを最初から行うためのエピソード的なトレーニングメカニズムに簡単に組み込むことができることに注意してください。 FSFGICタスクに関する広範な実験は、最先端のベンチマークに対する提案された方法の優位性を示しています。
Metric-based few-shot fine-grained image classification (FSFGIC) aims to learn a transferable feature embedding network by estimating the similarities between query images and support classes from very few examples. In this work, we propose, for the first time, to introduce the non-linear data projection concept into the design of FSFGIC architecture in order to address the limited sample problem in few-shot learning and at the same time to increase the discriminability of the model for fine-grained image classification. Specifically, we first design a feature re-abstraction embedding network that has the ability to not only obtain the required semantic features for effective metric learning but also re-enhance such features with finer details from input images. Then the descriptors of the query images and the support classes are projected into different non-linear spaces in our proposed similarity metric learning network to learn discriminative projection factors. This design can effectively operate in the challenging and restricted condition of a FSFGIC task for making the distance between the samples within the same class smaller and the distance between samples from different classes larger and for reducing the coupling relationship between samples from different categories. Furthermore, a novel similarity measure based on the proposed non-linear data project is presented for evaluating the relationships of feature information between a query image and a support set. It is worth to note that our proposed architecture can be easily embedded into any episodic training mechanisms for end-to-end training from scratch. Extensive experiments on FSFGIC tasks demonstrate the superiority of the proposed methods over the state-of-the-art benchmarks.
updated: Tue Jun 15 2021 04:22:17 GMT+0000 (UTC)
published: Sun Jun 13 2021 13:33:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト