arXiv reaDer
特権情報がアウェイ ラベル ノイズを説明するのはいつですか?
When does Privileged Information Explain Away Label Noise?
特権情報 (PI)、つまりトレーニング中には利用できるがテスト時には利用できない機能を活用することは、ラベル ノイズに対処するための効果的な方法であることが最近示されました。しかし、その効果の理由はよくわかっていません。この研究では、離れたラベル ノイズを説明する際に PI のさまざまなプロパティが果たす役割を調査します。実際の PI (CIFAR-N/H) と新しい大規模なベンチマーク ImageNet-PI を使用した複数のデータセットでの実験を通じて、学習のショートカットを有効にしながら、ネットワークがノイズの多いデータからクリーンなデータを簡単に区別できる場合に、PI が最も役立つことがわかりました。うるさい例を覚えるために。興味深いことに、PI がターゲット ラベルを予測しすぎると、PI メソッドは多くの場合、PI を使用しないベースラインよりもパフォーマンスが低下します。これらの調査結果に基づいて、最先端の PI メソッドに対するいくつかの機能強化を提案し、ラベル ノイズに取り組む手段としての PI の可能性を示します。最後に、結果として得られる PI アプローチを、ラベル ノイズに対処するために設計された既存の非 PI 手法と簡単に組み合わせる方法を示します。
Leveraging privileged information (PI), or features available during training but not at test time, has recently been shown to be an effective method for addressing label noise. However, the reasons for its effectiveness are not well understood. In this study, we investigate the role played by different properties of the PI in explaining away label noise. Through experiments on multiple datasets with real PI (CIFAR-N/H) and a new large-scale benchmark ImageNet-PI, we find that PI is most helpful when it allows networks to easily distinguish clean from noisy data, while enabling a learning shortcut to memorize the noisy examples. Interestingly, when PI becomes too predictive of the target label, PI methods often perform worse than their no-PI baselines. Based on these findings, we propose several enhancements to the state-of-the-art PI methods and demonstrate the potential of PI as a means of tackling label noise. Finally, we show how we can easily combine the resulting PI approaches with existing no-PI techniques designed to deal with label noise.
updated: Fri Mar 03 2023 09:25:39 GMT+0000 (UTC)
published: Fri Mar 03 2023 09:25:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト