arXiv reaDer
誰も置き去りにしない: ロングテール ラーニングにおける最悪のカテゴリの改善
No One Left Behind: Improving the Worst Categories in Long-Tailed Learning
バランスの取れたトレーニング データセットを使用する場合とは異なり、不均衡なデータセットでトレーニングされたニューラル ネットワークのクラスごとの再現率 (つまり、精度) は、カテゴリによって大きく異なることが知られています。ロングテール認識の慣例は、すべてのカテゴリを手動で 3 つのサブセットに分割し、各サブセット内の平均精度を報告することです。このような評価設定では、いくつかのカテゴリが必然的に犠牲になると主張します。一方では、バランスのとれたテスト セットの平均精度に注目すると、パフォーマンスが最も悪いカテゴリの精度が 0 であっても、ペナルティはほとんどありません。一方、「少数」サブセットのクラスは、必ずしも「多数」または「中」サブセットのクラスよりもパフォーマンスが悪いわけではありません。したがって、すべてのカテゴリの中で最も低い再現率と、すべての再現率値の調和平均を改善することにもっと集中することをお勧めします。具体的には、幅広い手法に適用可能なシンプルなプラグイン手法を提案します。提案された損失関数を使用して既存の事前トレーニング済みモデルの分類器を再トレーニングし、2 つの分類器の予測を組み合わせるオプションのアンサンブル トリックを使用するだけで、カテゴリ全体でリコール値のより均一な分布を実現できます。 (算術)平均精度は依然として高いですが、高調波平均精度は高くなります。私たちの方法の有効性は、広く使用されているベンチマーク データセットで正当化されます。
Unlike the case when using a balanced training dataset, the per-class recall (i.e., accuracy) of neural networks trained with an imbalanced dataset are known to vary a lot from category to category. The convention in long-tailed recognition is to manually split all categories into three subsets and report the average accuracy within each subset. We argue that under such an evaluation setting, some categories are inevitably sacrificed. On one hand, focusing on the average accuracy on a balanced test set incurs little penalty even if some worst performing categories have zero accuracy. On the other hand, classes in the "Few" subset do not necessarily perform worse than those in the "Many" or "Medium" subsets. We therefore advocate to focus more on improving the lowest recall among all categories and the harmonic mean of all recall values. Specifically, we propose a simple plug-in method that is applicable to a wide range of methods. By simply re-training the classifier of an existing pre-trained model with our proposed loss function and using an optional ensemble trick that combines the predictions of the two classifiers, we achieve a more uniform distribution of recall values across categories, which leads to a higher harmonic mean accuracy while the (arithmetic) average accuracy is still high. The effectiveness of our method is justified on widely used benchmark datasets.
updated: Tue Mar 07 2023 03:24:54 GMT+0000 (UTC)
published: Tue Mar 07 2023 03:24:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト