Webly Supervised Fine-Grained Recognition: Benchmark Datasets and An Approach
Webから学習することで、手動でラベル付けされた大規模なデータセットへのディープラーニングの極端な依存を緩和できます。特に、下位のカテゴリを区別することを目的としたきめ細かい認識の場合、無料のWebデータを活用することで、ラベル付けのコストを大幅に削減します。その重要な実用的および研究的価値にもかかわらず、主に高品質のデータセットが不足しているため、Webで監視されたきめ細かい認識問題はコンピュータビジョンコミュニティで広く研究されていません。このギャップを埋めるために、このペーパーでは、それぞれWebFG-496およびWebiNat-5089と呼ばれる2つの新しいベンチマークWeb監視細粒度データセットを構築します。具体的には、WebFG-496は、200種の鳥(Web-bird)、100種類の航空機(Web-aircraft)、および196モデルの車(Web-car)を含む合計53,339のWebトレーニング画像を含む3つのサブデータセットで構成されています。 )。 WebiNat-5089の場合、5089のサブカテゴリと110万を超えるWebトレーニング画像が含まれています。これは、Webで監視された史上最大のきめ細かいデータセットです。マイナーな貢献として、これらのデータセットをベンチマークするための新しいWeb監視あり方法(「ピアラーニング」と呼ばれる)も提案します.2つの新しいベンチマークデータセットの包括的な実験結果と分析は、提案された方法が競合するものよりも優れたパフォーマンスを達成することを示していますベースラインモデルと最先端。ベンチマークデータセットとピアラーニングのソースコードは、で入手できます。
Learning from the web can ease the extreme dependence of deep learning on large-scale manually labeled datasets. Especially for fine-grained recognition, which targets at distinguishing subordinate categories, it will significantly reduce the labeling costs by leveraging free web data. Despite its significant practical and research value, the webly supervised fine-grained recognition problem is not extensively studied in the computer vision community, largely due to the lack of high-quality datasets. To fill this gap, in this paper we construct two new benchmark webly supervised fine-grained datasets, termed WebFG-496 and WebiNat-5089, respectively. In concretely, WebFG-496 consists of three sub-datasets containing a total of 53,339 web training images with 200 species of birds (Web-bird), 100 types of aircrafts (Web-aircraft), and 196 models of cars (Web-car). For WebiNat-5089, it contains 5089 sub-categories and more than 1.1 million web training images, which is the largest webly supervised fine-grained dataset ever. As a minor contribution, we also propose a novel webly supervised method (termed ``Peer-learning'') for benchmarking these datasets.~Comprehensive experimental results and analyses on two new benchmark datasets demonstrate that the proposed method achieves superior performance over the competing baseline models and states-of-the-art. Our benchmark datasets and the source codes of Peer-learning have been made available at
updated: Thu Aug 05 2021 06:28:32 GMT+0000 (UTC)
published: Thu Aug 05 2021 06:28:32 GMT+0000 (UTC)
