ディープラーニングは、大量のビッグデータの助けを借りて、多数のドメインで驚くべき成功を収めてきました。ただし、多くの実際のシナリオには高品質のラベルがないため、データラベルの品質が問題になります。ノイズの多いラベルはディープニューラルネットワークの一般化パフォーマンスを大幅に低下させるため、ノイズの多いラベルからの学習(堅牢なトレーニング)は、最新のディープラーニングアプリケーションで重要なタスクになりつつあります。この調査では、最初に教師付き学習の観点からラベルノイズによる学習の問題について説明します。次に、46の最先端の堅牢なトレーニング方法の包括的なレビューを提供します。これらはすべて、方法論の違いに従って7つのグループに分類され、その後、その優位性を評価するために使用される6つのプロパティの体系的な比較が続きます。続いて、一般的なノイズの多いデータセットや評価指標など、一般的に使用される評価方法をまとめます。最後に、将来の研究のためのガイドラインとして役立つことができるいくつかの有望な研究方向を提示します。
Deep learning has achieved remarkable success in numerous domains with help from large amounts of big data. However, the quality of data labels is a concern because of the lack of high-quality labels in many real-world scenarios. As noisy labels severely degrade the generalization performance of deep neural networks, learning from noisy labels (robust training) is becoming an important task in modern deep learning applications. In this survey, we first describe the problem of learning with label noise from a supervised learning perspective. Next, we provide a comprehensive review of 46 state-of-the-art robust training methods, all of which are categorized into seven groups according to their methodological difference, followed by a systematic comparison of six properties used to evaluate their superiority. Subsequently, we summarize the typically used evaluation methodology, including public noisy datasets and evaluation metrics. Finally, we present several promising research directions that can serve as a guideline for future studies.