arXiv reaDer
ロングテール認識のための相互排他的変調器
Mutual Exclusive Modulator for Long-Tailed Recognition
ロングテール認識 (LTR) は、カテゴリ間で非常に不均衡なトレーニング サンプルを与えられた高性能分類子を学習するタスクです。既存の研究のほとんどは、テールクラスの機能を強化するか、分類子のバランスを取り直して誘導バイアスを減らすことにより、問題に対処しています。このホワイト ペーパーでは、LTR タスクの根本原因、つまり、各クラスのトレーニング サンプルが大きく不均衡であるという原因を調査し、簡単な解決策を提案します。学習画像の数に応じて、カテゴリを多、中、少の 3 つのグループに分けます。カテゴリの 3 つのグループは、分類の難しさを軽減するために個別に予測されます。この考えは、与えられたサンプルを適切なクラスグループに割り当てる方法という新しい問題を自然に引き起こしますか?各グループに属する画像の確率を推定できる相互排他的変調器を導入します。特に、変調器は軽量なモジュールで構成されており、相互排他的な目的で学習されます。したがって、変調器の出力確率は、トレーニング データセットのデータ ボリュームの手がかりをエンコードします。それらは、分類子の予測を導くための事前情報としてさらに利用されます。提案されたアプローチを評価するために、ImageNet-LT、Place-LT、iNaturalist 2018 などの複数のデータセットで広範な実験を行います。私たちの方法は、最先端のベンチマークと比較して競争力のあるパフォーマンスを実現します。
The long-tailed recognition (LTR) is the task of learning high-performance classifiers given extremely imbalanced training samples between categories. Most of the existing works address the problem by either enhancing the features of tail classes or re-balancing the classifiers to reduce the inductive bias. In this paper, we try to look into the root cause of the LTR task, i.e., training samples for each class are greatly imbalanced, and propose a straightforward solution. We split the categories into three groups, i.e., many, medium and few, according to the number of training images. The three groups of categories are separately predicted to reduce the difficulty for classification. This idea naturally arises a new problem of how to assign a given sample to the right class groups? We introduce a mutual exclusive modulator which can estimate the probability of an image belonging to each group. Particularly, the modulator consists of a light-weight module and learned with a mutual exclusive objective. Hence, the output probabilities of the modulator encode the data volume clues of the training dataset. They are further utilized as prior information to guide the prediction of the classifier. We conduct extensive experiments on multiple datasets, e.g., ImageNet-LT, Place-LT and iNaturalist 2018 to evaluate the proposed approach. Our method achieves competitive performance compared to the state-of-the-art benchmarks.
updated: Tue Apr 11 2023 07:28:14 GMT+0000 (UTC)
published: Sun Feb 19 2023 07:31:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト