arXiv reaDer
ワンショット視覚分類タスクの曖昧さの解消: シンプレックスベースのアプローチ
Disambiguation of One-Shot Visual Classification Tasks: A Simplex-Based Approach
ビジュアル フューズ ショット分類の分野は、ディープ ラーニング ビジュアル システムの最先端のパフォーマンスを、非常に限られた数のトレーニング サンプルしか利用できないタスクに適用することを目的としています。主な解決策は、考慮される少数ショット タスクに適用される大規模で多様なデータセットを使用して特徴抽出器をトレーニングすることです。特徴抽出器でエンコードされた事前分布のおかげで、ショットがそのクラスを代表していない個々の特徴を表示する場合でも、各クラスの例 (または「ショット」) が 1 つだけの分類タスクを高い精度で解決できます。与えられたショットのいくつかが複数のオブジェクトを表示する場合, 問題はより複雑になります. この論文では, 特定のショットで以前に見えなかった複数のオブジェクトの存在を検出することを目的とした戦略を提示します. この方法論は, のコーナーを識別することに基づいています.高次元空間でのシンプレックス. 最適化ルーチンを導入し、未加工の画像で複数の (以前は見えなかった) オブジェクトを正常に検出するその機能を紹介します. 次に、複数のオブジェクトの存在を利用して少数のパフォーマンスを向上させることを目的とした下流の分類器を導入します-ショットの分類, そのクラスに 1 つのショットのみが与えられる極端な設定の場合. フィールドの標準的なベンチマークを使用して, 能力を示します提案された方法を使用すると、これらの設定での精度がわずかに改善されますが、統計的に有意に改善されます。
The field of visual few-shot classification aims at transferring the state-of-the-art performance of deep learning visual systems onto tasks where only a very limited number of training samples are available. The main solution consists in training a feature extractor using a large and diverse dataset to be applied to the considered few-shot task. Thanks to the encoded priors in the feature extractors, classification tasks with as little as one example (or "shot'') for each class can be solved with high accuracy, even when the shots display individual features not representative of their classes. Yet, the problem becomes more complicated when some of the given shots display multiple objects. In this paper, we present a strategy which aims at detecting the presence of multiple and previously unseen objects in a given shot. This methodology is based on identifying the corners of a simplex in a high dimensional space. We introduce an optimization routine and showcase its ability to successfully detect multiple (previously unseen) objects in raw images. Then, we introduce a downstream classifier meant to exploit the presence of multiple objects to improve the performance of few-shot classification, in the case of extreme settings where only one shot is given for its class. Using standard benchmarks of the field, we show the ability of the proposed method to slightly, yet statistically significantly, improve accuracy in these settings.
updated: Mon Jan 16 2023 11:37:05 GMT+0000 (UTC)
published: Mon Jan 16 2023 11:37:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト