実世界のデータは通常、深刻なクラスの不均衡とロングテール分布に悩まされており、多数派のクラスに比べて少数派のクラスが大幅に過小評価されています。最近の研究では、マルチエキスパート アーキテクチャを利用して少数派のモデルの不確実性を軽減することを好みます。そこでは、専門家の知識を集約するために共同学習が使用されます。つまり、オンライン蒸留です。この論文では、専門家間の知識伝達がクラス分布に関して不均衡であり、その結果、少数派クラスのパフォーマンスの改善が制限されていることがわかります。これに対処するために、2 つの分類器の予測を比較することにより、再重み付けされた蒸留損失を提案します。これらの予測は、それぞれオンライン蒸留とラベル注釈によって監視されます。また、機能レベルの蒸留により、モデルのパフォーマンスが大幅に向上し、機能の堅牢性が向上することも強調します。最後に、対照的なプロキシ タスク ブランチを統合して機能の品質をさらに向上させる効果的な共同学習 (ECL) フレームワークを提案します。 4 つの標準データセットでの定量的および定性的な実験は、ECL が最先端のパフォーマンスを達成し、詳細なアブレーション研究が ECL の各コンポーネントの有効性を明らかにしていることを示しています。
Real-world data usually suffers from severe class imbalance and long-tailed distributions, where minority classes are significantly underrepresented compared to the majority ones. Recent research prefers to utilize multi-expert architectures to mitigate the model uncertainty on the minority, where collaborative learning is employed to aggregate the knowledge of experts, i.e., online distillation. In this paper, we observe that the knowledge transfer between experts is imbalanced in terms of class distribution, which results in limited performance improvement of the minority classes. To address it, we propose a re-weighted distillation loss by comparing two classifiers' predictions, which are supervised by online distillation and label annotations, respectively. We also emphasize that feature-level distillation will significantly improve model performance and increase feature robustness. Finally, we propose an Effective Collaborative Learning (ECL) framework that integrates a contrastive proxy task branch to further improve feature quality. Quantitative and qualitative experiments on four standard datasets demonstrate that ECL achieves state-of-the-art performance and the detailed ablation studies manifest the effectiveness of each component in ECL.