PARN: Position-Aware Relation Networks for Few-Shot Learning
  少数ショットの学習では、分類器がトレーニングセットに表示されない新しいクラスに迅速に適応する必要があるという課題があります。これは、各新しいクラスのラベル付きの例がほんの数例あるだけです。この論文では、位置認識関係ネットワーク(PARN)を提案して、少数ショット学習のためのより柔軟で堅牢なメトリック能力を学習します。リレーショナル推論の一種であるリレーションネットワーク(RN)は、単純な畳み込みニューラルネットワーク(CNN)として設計されるだけで、画像の深いメトリック能力を獲得できます[23]。ただし、CNN固有のローカル接続性により、CNNベースの関係ネットワーク(RN)は、2つの比較画像内のセマンティックオブジェクトの空間的位置関係に敏感です。この問題に対処するために、変形可能な特徴抽出(DFE)を導入してより効率的な特徴を抽出し、二重相関アテンションメカニズム(DCA)を設計して固有のローカル接続を処理します。提案されたアプローチでは、少数のパラメーターのみを導入することで、RNがセマンティックオブジェクトを位置認識できる可能性を広げています。 2つの主要なベンチマークデータセット、つまりOmniglotとMini-Imagenetでアプローチを評価し、両方のデータセットで、アプローチは浅い特徴抽出ネットワークを使用する設定で最先端のパフォーマンスを達成します。 Omniglotでの5ウェイ1ショットの結果は、以前の5ウェイ5ショットの結果よりも優れていることは注目に値します。
Few-shot learning presents a challenge that a classifier must quickly adapt to new classes that do not appear in the training set, given only a few labeled examples of each new class. This paper proposes a position-aware relation network (PARN) to learn a more flexible and robust metric ability for few-shot learning. Relation networks (RNs), a kind of architectures for relational reasoning, can acquire a deep metric ability for images by just being designed as a simple convolutional neural network (CNN) [23]. However, due to the inherent local connectivity of CNN, the CNN-based relation network (RN) can be sensitive to the spatial position relationship of semantic objects in two compared images. To address this problem, we introduce a deformable feature extractor (DFE) to extract more efficient features, and design a dual correlation attention mechanism (DCA) to deal with its inherent local connectivity. Successfully, our proposed approach extents the potential of RN to be position-aware of semantic objects by introducing only a small number of parameters. We evaluate our approach on two major benchmark datasets, i.e., Omniglot and Mini-Imagenet, and on both of the datasets our approach achieves state-of-the-art performance with the setting of using a shallow feature extraction network. It's worth noting that our 5-way 1-shot result on Omniglot even outperforms the previous 5-way 5-shot results.
updated: Tue Sep 10 2019 07:39:32 GMT+0000 (UTC)
published: Tue Sep 10 2019 07:39:32 GMT+0000 (UTC)
