arXiv reaDer
マルチレベルの2次数ショット学習
Multi-level Second-order Few-shot Learning
教師ありまたは教師なしの数ショット画像分類と数ショット行動認識のためのマルチレベル2次(MlSo)数ショット学習ネットワークを提案します。いわゆるパワー正規化された2次ベース学習者ストリームを、複数レベルの視覚的抽象化を表現する機能と組み合わせて活用し、自己監視型の識別メカニズムを使用します。二次プーリング(SoP)は画像認識で人気があるため、パイプラインではその基本的な要素ごとのバリアントを採用しています。マルチレベルの機能設計の目標は、CNNのさまざまなレイヤーごとのレベルで機能表現を抽出し、いくつかのレベルの視覚的抽象化を実現して、堅牢な数ショットの学習を実現することです。 SoPはさまざまな空間サイズの畳み込み特徴マップを処理できるため、複数の空間スケールでの画像入力もMlSoに導入します。マルチレベルおよびマルチスケールの機能からの識別情報を活用するために、それぞれのブランチを再重み付けする機能マッチング(FM)モジュールを開発します。また、空間レベルと抽象化のスケールの識別器である自己監視ステップを紹介します。私たちのパイプラインは、エンドツーエンドの方法でトレーニングされています。シンプルなアーキテクチャで、Omniglot、mini-ImageNet、tiered-ImageNet、Open MIC、CUB Birds、Stanford Dogs and Carsなどのきめ細かいデータセット、HMDB51、UCF101などのアクション認識データセットで立派な結果を示します。 、およびミニMIT。
We propose a Multi-level Second-order (MlSo) few-shot learning network for supervised or unsupervised few-shot image classification and few-shot action recognition. We leverage so-called power-normalized second-order base learner streams combined with features that express multiple levels of visual abstraction, and we use self-supervised discriminating mechanisms. As Second-order Pooling (SoP) is popular in image recognition, we employ its basic element-wise variant in our pipeline. The goal of multi-level feature design is to extract feature representations at different layer-wise levels of CNN, realizing several levels of visual abstraction to achieve robust few-shot learning. As SoP can handle convolutional feature maps of varying spatial sizes, we also introduce image inputs at multiple spatial scales into MlSo. To exploit the discriminative information from multi-level and multi-scale features, we develop a Feature Matching (FM) module that reweights their respective branches. We also introduce a self-supervised step, which is a discriminator of the spatial level and the scale of abstraction. Our pipeline is trained in an end-to-end manner. With a simple architecture, we demonstrate respectable results on standard datasets such as Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, fine-grained datasets such as CUB Birds, Stanford Dogs and Cars, and action recognition datasets such as HMDB51, UCF101, and mini-MIT.
updated: Sat Jan 15 2022 19:49:00 GMT+0000 (UTC)
published: Sat Jan 15 2022 19:49:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト