arXiv reaDer
Learning from Web Data with Self-Organizing Memory Module
 Webデータからの学習は、近年多くの研究関心を集めています。ただし、クロールされたWeb画像には通常、ラベルノイズとバックグラウンドノイズの2種類のノイズがあり、それらを効果的に利用するのは非常に困難です。ほとんどの既存の方法は、人間の監督に頼るか、バックグラウンドノイズを無視します。本論文では、トレーニング段階でクリーンな画像を管理することなく、これら2種類のノイズを一緒に処理できる新しい方法を提案します。特に、同じカテゴリのROI(つまり、画像とその地域の提案)をバッグにグループ化することにより、マルチインスタンス学習のフレームワークの下でメソッドを定式化します。各バッグのROIには、最も近いクラスターの代表/識別スコアに基づいて異なる重みが割り当てられます。クラスターとそのスコアは、設計されたメモリモジュールを介して取得されます。私たちのメモリモジュールは、分類モジュールと自然に統合でき、エンドツーエンドのトレーニング可能なシステムにつながります。 4つのベンチマークデータセットに関する広範な実験により、この方法の有効性が実証されています。
Learning from web data has attracted lots of research interest in recent years. However, crawled web images usually have two types of noises, label noise and background noise, which induce extra difficulties in utilizing them effectively. Most existing methods either rely on human supervision or ignore the background noise. In this paper, we propose a novel method, which is capable of handling these two types of noises together, without the supervision of clean images in the training stage. Particularly, we formulate our method under the framework of multi-instance learning by grouping ROIs (i.e., images and their region proposals) from the same category into bags. ROIs in each bag are assigned with different weights based on the representative/discriminative scores of their nearest clusters, in which the clusters and their scores are obtained via our designed memory module. Our memory module could be naturally integrated with the classification module, leading to an end-to-end trainable system. Extensive experiments on four benchmark datasets demonstrate the effectiveness of our method.
updated: Wed Mar 11 2020 17:08:27 GMT+0000 (UTC)
published: Fri Jun 28 2019 03:29:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト