arXiv reaDer
FoodLogoDet-1500:マルチスケール機能デカップリングネットワークを介した大規模な食品ロゴ検出用のデータセット
FoodLogoDet-1500: A Dataset for Large-Scale Food Logo Detection via Multi-Scale Feature Decoupling Network
食品のロゴ検出は、セルフサービスショップの食品推奨や、eコマースプラットフォームでの侵害検出など、幅広い実世界のアプリケーションのマルチメディアで重要な役割を果たします。高度な食品ロゴ検出アルゴリズムを開発するには、大規模な食品ロゴデータセットが緊急に必要です。ただし、食品のブランド情報を含む利用可能な食品ロゴデータセットはありません。食品ロゴの検出に向けた取り組みをサポートするために、データセットFoodLogoDet-1500を紹介します。これは、1,500のカテゴリ、約100,000の画像、約150,000の手動で注釈が付けられた食品ロゴオブジェクトを含む、新しい大規模な公開食品ロゴデータセットです。 FoodLogoDet-1500の収集と注釈のプロセスについて説明し、その規模と多様性を分析して、他のロゴデータセットと比較します。私たちの知る限り、FoodLogoDet-1500は、食品のロゴを検出するための最初の最大の公的に利用可能な高品質のデータセットです。食品ロゴ検出の課題は、食品ロゴカテゴリ間の大規模なカテゴリと類似性にあります。そのために、分類と回帰を2つのブランチに分離し、分類ブランチに焦点を当てて複数の食品ロゴカテゴリを区別する問題を解決する、新しい食品ロゴ検出方法マルチスケール特徴デカップリングネットワーク(MFDNet)を提案します。具体的には、変形学習を利用して最適な分類オフセットを実現し、検出における分類の最も代表的な特徴を効果的に取得できる特徴オフセットモジュールを紹介します。さらに、MFDNetにはバランスの取れた特徴ピラミッドを採用しています。これは、グローバル情報に注意を払い、マルチスケールの特徴マップのバランスを取り、特徴抽出機能を強化します。 FoodLogoDet-1500および他の2つのベンチマークロゴデータセットに関する包括的な実験は、提案された方法の有効性を示しています。 FoodLogoDet-1500は、このhttpsURLにあります。
Food logo detection plays an important role in the multimedia for its wide real-world applications, such as food recommendation of the self-service shop and infringement detection on e-commerce platforms. A large-scale food logo dataset is urgently needed for developing advanced food logo detection algorithms. However, there are no available food logo datasets with food brand information. To support efforts towards food logo detection, we introduce the dataset FoodLogoDet-1500, a new large-scale publicly available food logo dataset, which has 1,500 categories, about 100,000 images and about 150,000 manually annotated food logo objects. We describe the collection and annotation process of FoodLogoDet-1500, analyze its scale and diversity, and compare it with other logo datasets. To the best of our knowledge, FoodLogoDet-1500 is the first largest publicly available high-quality dataset for food logo detection. The challenge of food logo detection lies in the large-scale categories and similarities between food logo categories. For that, we propose a novel food logo detection method Multi-scale Feature Decoupling Network (MFDNet), which decouples classification and regression into two branches and focuses on the classification branch to solve the problem of distinguishing multiple food logo categories. Specifically, we introduce the feature offset module, which utilizes the deformation-learning for optimal classification offset and can effectively obtain the most representative features of classification in detection. In addition, we adopt a balanced feature pyramid in MFDNet, which pays attention to global information, balances the multi-scale feature maps, and enhances feature extraction capability. Comprehensive experiments on FoodLogoDet-1500 and other two benchmark logo datasets demonstrate the effectiveness of the proposed method. The FoodLogoDet-1500 can be found at this https URL.
updated: Tue Aug 10 2021 12:47:04 GMT+0000 (UTC)
published: Tue Aug 10 2021 12:47:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト