arXiv reaDer
正確な食品認識のための識別可能な食品地域のマイニング
Mining Discriminative Food Regions for Accurate Food Recognition
自動食品認識は、受動的な食事モニタリングに向けた最初のステップです。この論文では、識別可能な食品領域をマイニングすることにより、食品認識の問題に対処します。弱教師ありセグメンテーションの識別オブジェクト領域を段階的に発見する戦略であるAdversarialErasingからインスピレーションを得て、プライマリネットワークが入力画像を分類する基本精度を維持し、補助ネットワークが識別食品領域を敵対的にマイニングする新しいネットワークアーキテクチャを提案します。リージョンネットワークは、結果として得られるマイニングされたリージョンを分類します。次に、グローバル(元の入力画像)とローカル(マイニングされた領域)の表現が統合され、最終的な予測が行われます。 PAR-Netとして示される提案されたアーキテクチャは、エンドツーエンドでトレーニング可能であり、オンラインで識別可能な領域を強調します。さらに、50の異なる寿司カテゴリで構成されるSushi-50という名前の新しいきめの細かい食品データセットを紹介します。提案されたアプローチを評価するために、広範な実験が行われた。選択した3つの食品データセット(Food-101、Vireo-172、Sushi-50)で、私たちのアプローチは一貫して実行され、最先端の結果を達成します(90.4%、90.2%、92.0%のトップ1テスト精度、それぞれ)他の既存のアプローチと比較して。データセットとコードはhttps://github.com/Jianing-Qiu/PARNetで入手できます。
Automatic food recognition is the very first step towards passive dietary monitoring. In this paper, we address the problem of food recognition by mining discriminative food regions. Taking inspiration from Adversarial Erasing, a strategy that progressively discovers discriminative object regions for weakly supervised semantic segmentation, we propose a novel network architecture in which a primary network maintains the base accuracy of classifying an input image, an auxiliary network adversarially mines discriminative food regions, and a region network classifies the resulting mined regions. The global (the original input image) and the local (the mined regions) representations are then integrated for the final prediction. The proposed architecture denoted as PAR-Net is end-to-end trainable, and highlights discriminative regions in an online fashion. In addition, we introduce a new fine-grained food dataset named as Sushi-50, which consists of 50 different sushi categories. Extensive experiments have been conducted to evaluate the proposed approach. On three food datasets chosen (Food-101, Vireo-172, and Sushi-50), our approach performs consistently and achieves state-of-the-art results (top-1 testing accuracy of 90.4%, 90.2%, 92.0%, respectively) compared with other existing approaches. Dataset and code are available at https://github.com/Jianing-Qiu/PARNet
updated: Fri Jul 08 2022 05:09:24 GMT+0000 (UTC)
published: Fri Jul 08 2022 05:09:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト