arXiv reaDer
ノイズの多いラベルを使用したロングテールデータからの学習
Learning From Long-Tailed Data With Noisy Labels
多くの大規模な分類データセットでは、クラスの不均衡とノイズの多いラベルが例外ではなく標準です。それにもかかわらず、機械学習のほとんどの作業は、通常、バランスの取れたクリーンなデータを前提としています。ノイズの多いラベルから学習する問題と、ロングテールデータから学習する問題に取り組む最近の試みがいくつかあります。メソッドの各グループは、他のメソッドについて単純化した仮定を行います。この分離により、提案されたソリューションは、両方の仮定に違反した場合にパフォーマンスが低下することがよくあります。この作業では、両方の課題を同時に処理するための自己教師あり学習の最近の進歩に基づいた、単純な2段階のアプローチを紹介します。これは、最初に、タスクにとらわれない自己監視による事前トレーニングと、それに続く適切な損失を使用したタスク固有の微調整で構成されます。最も重要なことは、自己教師あり学習アプローチが深刻なクラスの不均衡に効果的に対処できることです。さらに、結果として得られる学習された表現は、不均衡およびノイズ耐性のある損失関数で微調整された場合、ラベルノイズに対しても非常に堅牢です。合成の不均衡とノイズで補強されたCIFAR-10とCIFAR-100の実験、および大規模で本質的にノイズの多いClothing-1Mデータセットを使用して、主張を検証します。
Class imbalance and noisy labels are the norm rather than the exception in many large-scale classification datasets. Nevertheless, most works in machine learning typically assume balanced and clean data. There have been some recent attempts to tackle, on one side, the problem of learning from noisy labels and, on the other side, learning from long-tailed data. Each group of methods make simplifying assumptions about the other. Due to this separation, the proposed solutions often underperform when both assumptions are violated. In this work, we present a simple two-stage approach based on recent advances in self-supervised learning to treat both challenges simultaneously. It consists of, first, task-agnostic self-supervised pre-training, followed by task-specific fine-tuning using an appropriate loss. Most significantly, we find that self-supervised learning approaches are effectively able to cope with severe class imbalance. In addition, the resulting learned representations are also remarkably robust to label noise, when fine-tuned with an imbalance- and noise-resistant loss function. We validate our claims with experiments on CIFAR-10 and CIFAR-100 augmented with synthetic imbalance and noise, as well as the large-scale inherently noisy Clothing-1M dataset.
updated: Wed Aug 25 2021 07:45:40 GMT+0000 (UTC)
published: Wed Aug 25 2021 07:45:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト