arXiv reaDer
ノイズの多いラベル修正のためのマニホールドベースのデータ分割によるアンサンブル学習
Ensemble Learning with Manifold-Based Data Splitting for Noisy Label Correction
トレーニングデータのラベルノイズは、教師あり学習タスクのモデルの一般化パフォーマンスを大幅に低下させる可能性があります。ここでは、ノイズの多いラベルが主に誤ってラベル付けされたサンプルであり、均一に分散されるのではなく、決定境界の近くに集中する傾向があり、その特徴があいまいである必要があるという問題に焦点を当てます。この問題に対処するために、特徴多様体の局所構造を利用してノイズの多いラベルを修正するアンサンブル学習法を提案します。特定の損失項を介してサブモデル間の予測の多様性を高める典型的なアンサンブル戦略とは異なり、私たちの方法は、データ多様体上でランダムに選択されたシードサンプルの最近傍の和集合である互いに素なサブセットでサブモデルをトレーニングします。その結果、各サブモデルは、対応するグラフとともにデータ多様体の大まかな表現を学習できます。さらに、限られた数のサブモデルのみが、局所的に集中したノイズの多いラベルの影響を受けます。作成されたグラフは、一連のラベル修正候補を提案するために使用されます。したがって、私たちの方法は、一貫性のない提案に投票することによってラベル修正結果を導き出します。実世界のノイズの多いラベルデータセットに関する私たちの実験は、既存の最先端技術に対する提案された方法の優位性を示しています。
Label noise in training data can significantly degrade a model's generalization performance for supervised learning tasks. Here we focus on the problem that noisy labels are primarily mislabeled samples, which tend to be concentrated near decision boundaries, rather than uniformly distributed, and whose features should be equivocal. To address the problem, we propose an ensemble learning method to correct noisy labels by exploiting the local structures of feature manifolds. Different from typical ensemble strategies that increase the prediction diversity among sub-models via certain loss terms, our method trains sub-models on disjoint subsets, each being a union of the nearest-neighbors of randomly selected seed samples on the data manifold. As a result, each sub-model can learn a coarse representation of the data manifold along with a corresponding graph. Moreover, only a limited number of sub-models will be affected by locally-concentrated noisy labels. The constructed graphs are used to suggest a series of label correction candidates, and accordingly, our method derives label correction results by voting down inconsistent suggestions. Our experiments on real-world noisy label datasets demonstrate the superiority of the proposed method over existing state-of-the-arts.
updated: Sat Mar 13 2021 07:24:58 GMT+0000 (UTC)
published: Sat Mar 13 2021 07:24:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト