arXiv reaDer
機能依存のラベルノイズによる学習:進歩的なアプローチ
Learning with Feature-Dependent Label Noise: A Progressive Approach
ラベルノイズは、実際の大規模データセットで頻繁に観察されます。ノイズはさまざまな理由で発生します。それは異種であり、機能に依存します。ノイズの多いラベルを処理するための既存のアプローチのほとんどは、2つのカテゴリに分類されます。理想的な機能に依存しないノイズを想定するか、理論的な保証なしにヒューリスティックなままです。この論文では、特徴に依存するラベルノイズの新しいファミリをターゲットにすることを提案します。これは、一般的に使用されるiidラベルノイズよりもはるかに一般的で、幅広いノイズパターンを網羅しています。この一般的なノイズファミリに焦点を当てて、ラベルを繰り返し修正し、モデルを改良するプログレッシブラベル修正アルゴリズムを提案します。多種多様な(未知の)ノイズパターンに対して、この戦略でトレーニングされた分類器が収束してベイズ分類器と一致することを示す理論的保証を提供します。実験では、私たちの方法はSOTAベースラインを上回り、さまざまなノイズタイプとレベルに対してロバストです。
Label noise is frequently observed in real-world large-scale datasets. The noise is introduced due to a variety of reasons; it is heterogeneous and feature-dependent. Most existing approaches to handling noisy labels fall into two categories: they either assume an ideal feature-independent noise, or remain heuristic without theoretical guarantees. In this paper, we propose to target a new family of feature-dependent label noise, which is much more general than commonly used i.i.d. label noise and encompasses a broad spectrum of noise patterns. Focusing on this general noise family, we propose a progressive label correction algorithm that iteratively corrects labels and refines the model. We provide theoretical guarantees showing that for a wide variety of (unknown) noise patterns, a classifier trained with this strategy converges to be consistent with the Bayes classifier. In experiments, our method outperforms SOTA baselines and is robust to various noise types and levels.
updated: Tue Mar 16 2021 07:28:12 GMT+0000 (UTC)
published: Sat Mar 13 2021 17:34:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト