arXiv reaDer
ノイズの多いラベルに対するKNN拡張ディープラーニング
KNN-enhanced Deep Learning Against Noisy Labels
ディープニューラルネットワーク(DNN)での教師あり学習は、データを大量に消費します。大きなデータセットを収集すると通常はノイズの多いラベルが取り込まれるため、ノイズの多いラベルが存在する場合にDNNのパフォーマンスを最適化することが最も重要になっています。データノイズに対するK最近傍法(KNN)の堅牢性に触発されて、この作業では、ラベルのクリーンアップにディープKNNを適用することを提案します。私たちのアプローチは、特徴抽出にDNNを活用し、グラウンドトゥルースラベル推論にKNNを活用します。ニューラルネットワークのトレーニングとラベルの更新を繰り返して、ラベルの回復率の向上と分類パフォーマンスの向上を同時に実現します。実験結果は、同じ設定の下で、私たちのアプローチが既存のラベル修正方法よりも優れており、複数のデータセットでより良い精度を達成することを示しています。
Supervised learning on Deep Neural Networks (DNNs) is data hungry. Optimizing performance of DNN in the presence of noisy labels has become of paramount importance since collecting a large dataset will usually bring in noisy labels. Inspired by the robustness of K-Nearest Neighbors (KNN) against data noise, in this work, we propose to apply deep KNN for label cleanup. Our approach leverages DNNs for feature extraction and KNN for ground-truth label inference. We iteratively train the neural network and update labels to simultaneously proceed towards higher label recovery rate and better classification performance. Experiment results show that under the same setting, our approach outperforms existing label correction methods and achieves better accuracy on multiple datasets, e.g.,76.78% on Clothing1M dataset.
updated: Tue Dec 08 2020 05:21:29 GMT+0000 (UTC)
published: Tue Dec 08 2020 05:21:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト