ノイズの多いラベルは、ディープニューラルネットワークのパフォーマンスを損なう可能性があります。この問題に取り組むために、本論文では、ラベルノイズをフィルタリングするための新しい方法を提案します。ノイズの多い分類器の事後確率に依存するほとんどの既存の方法とは異なり、潜在的な表現空間におけるデータのはるかに豊富な空間動作に焦点を当てます。データの高次トポロジー情報を活用することで、クリーンなデータのほとんどを収集し、高品質のモデルをトレーニングすることができます。理論的には、このトポロジカルアプローチがクリーンなデータを高い確率で収集することが保証されていることを証明します。経験的結果は、私たちの方法が最先端技術を上回り、幅広いノイズタイプとレベルに対してロバストであることを示しています。
Noisy labels can impair the performance of deep neural networks. To tackle this problem, in this paper, we propose a new method for filtering label noise. Unlike most existing methods relying on the posterior probability of a noisy classifier, we focus on the much richer spatial behavior of data in the latent representational space. By leveraging the high-order topological information of data, we are able to collect most of the clean data and train a high-quality model. Theoretically we prove that this topological approach is guaranteed to collect the clean data with high probability. Empirical results show that our method outperforms the state-of-the-arts and is robust to a broad spectrum of noise types and levels.