arXiv reaDer
Logo-2K +:スケーラブルなロゴ分類のための大規模なロゴデータセット
Logo-2K+: A Large-Scale Logo Dataset for Scalable Logo Classification
 ロゴ分類は、著作権侵害の検出、製品の推奨、コンテキスト広告など、さまざまなアプリケーションで注目を集めています。他の種類のオブジェクト画像と比較して、実世界のロゴ画像はロゴの外観がより多様で、背景がより複雑です。したがって、画像からロゴを認識することは困難です。スケーラブルなロゴ分類タスクに向けた取り組みをサポートするために、2,341のカテゴリと167,140の画像を備えた新しい大規模な公開されている現実世界のロゴデータセット、Logo-2K +をキュレーションしました。 FlickrLogos-32やLOGO-Netなどの既存の人気のあるロゴデータセットと比較して、Logo-2K +は、ロゴカテゴリとより多くのロゴ画像をより包括的にカバーしています。さらに、より有益なロゴ領域を発見し、ロゴ分類のためにこれらの画像領域を増強することができる識別領域ナビゲーションおよび増強ネットワーク(DRNA-Net)を提案します。 DRNA-Netは4つのサブネットワークで構成されています。ナビゲータサブネットワークは、教師サブネットワークに導かれた情報関連のロゴ関連領域を最初に選択しました。次に、データ拡張サブネットワークは、領域のトリミングと領域のドロップの両方を介して、選択された領域を拡張します。最後に、検査サブネットワークは、ロゴ分類のために拡張領域の機能と画像全体を融合します。 Logo-2K +および他の3つの既存のベンチマークデータセットに関する包括的な実験は、提案された方法の有効性を示しています。 Logo-2K +および提案されている強力なベースラインDRNA-Netは、スケーラブルなロゴ画像認識の開発を促進することが期待され、Logo-2K +データセットはhttps://github.com/msn199959/Logo-2k-plus-Datasetで見つけることができます。
Logo classification has gained increasing attention for its various applications, such as copyright infringement detection, product recommendation and contextual advertising. Compared with other types of object images, the real-world logo images have larger variety in logo appearance and more complexity in their background. Therefore, recognizing the logo from images is challenging. To support efforts towards scalable logo classification task, we have curated a dataset, Logo-2K+, a new large-scale publicly available real-world logo dataset with 2,341 categories and 167,140 images. Compared with existing popular logo datasets, such as FlickrLogos-32 and LOGO-Net, Logo-2K+ has more comprehensive coverage of logo categories and larger quantity of logo images. Moreover, we propose a Discriminative Region Navigation and Augmentation Network (DRNA-Net), which is capable of discovering more informative logo regions and augmenting these image regions for logo classification. DRNA-Net consists of four sub-networks: the navigator sub-network first selected informative logo-relevant regions guided by the teacher sub-network, which can evaluate its confidence belonging to the ground-truth logo class. The data augmentation sub-network then augments the selected regions via both region cropping and region dropping. Finally, the scrutinizer sub-network fuses features from augmented regions and the whole image for logo classification. Comprehensive experiments on Logo-2K+ and other three existing benchmark datasets demonstrate the effectiveness of proposed method. Logo-2K+ and the proposed strong baseline DRNA-Net are expected to further the development of scalable logo image recognition, and the Logo-2K+ dataset can be found at https://github.com/msn199959/Logo-2k-plus-Dataset.
updated: Mon Nov 11 2019 09:24:08 GMT+0000 (UTC)
published: Mon Nov 11 2019 09:24:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト