自然データは、多くの場合、セマンティッククラスにロングテールで分散されます。既存の認識方法は、クラスのリバランス/再重み付けまたは異なるデータグループのアンサンブルを通じて、テールデータにさらに重点を置くことにより、この不均衡な分類に対処します。その結果、テールの精度は向上しますが、ヘッドの精度は低下します。トレーニングデータの動的なビューを取得し、トレーニングデータの変動に応じて、原理的なモデルバイアスと分散分析を提供します。既存のロングテール分類器は常にモデル分散を増加させ、ヘッドテールモデルのバイアスギャップはますます大きくなるため、大きいままです。テールのハードネガとの混同。 RoutIng Diverse Experts(RIDE)と呼ばれる新しいロングテール分類器を提案します。複数のエキスパートによるモデルの分散を減らし、分布を意識したダイバーシティ損失によるモデルのバイアスを減らし、動的なエキスパートルーティングモジュールによる計算コストを削減します。 RIDEは、CIFAR100-LT、ImageNet-LT、およびiNaturalist 2018ベンチマークで、最先端のパフォーマンスを5%から7%上回っています。また、さまざまなバックボーンネットワーク、ロングテールアルゴリズム、および一貫したパフォーマンス向上のためのトレーニングメカニズムに適用できるユニバーサルフレームワークでもあります。私たちのコードはhttps://github.com/frank-xwang/RIDE-LongTailRecognitionで入手できます。
Natural data are often long-tail distributed over semantic classes. Existing recognition methods tackle this imbalanced classification by placing more emphasis on the tail data, through class re-balancing/re-weighting or ensembling over different data groups, resulting in increased tail accuracies but reduced head accuracies. We take a dynamic view of the training data and provide a principled model bias and variance analysis as the training data fluctuates: Existing long-tail classifiers invariably increase the model variance and the head-tail model bias gap remains large, due to more and larger confusion with hard negatives for the tail. We propose a new long-tailed classifier called RoutIng Diverse Experts (RIDE). It reduces the model variance with multiple experts, reduces the model bias with a distribution-aware diversity loss, reduces the computational cost with a dynamic expert routing module. RIDE outperforms the state-of-the-art by 5% to 7% on CIFAR100-LT, ImageNet-LT and iNaturalist 2018 benchmarks. It is also a universal framework that is applicable to various backbone networks, long-tailed algorithms, and training mechanisms for consistent performance gains. Our code is available at: https://github.com/frank-xwang/RIDE-LongTailRecognition.