次の論文では、食品の画像からカロリーを予測するタスクに人間の顕著性を組み込むことの有効性を調査しています。最もカロリーの高い領域を強調表示する食品の画像に顕著性マップを組み込むと、32.2% の相対的な改善が観察されました。また、質量推定と食品分類の同様のタスクで事前トレーニングされた重みを使用して最適なモデルを開始することで、精度をさらに向上させることも試みます。しかし、改善は見られません。驚くべきことに、私たちの最良のモデルは、テスト データセット Nutrition5k とともに公開された元のパフォーマンスを超えることができなかったこともわかりました。実験のベースモデルとして ResNet50 と Xception を使用します。
The following paper investigates the effectiveness of incorporating human salience into the task of calorie prediction from images of food. We observe a 32.2% relative improvement when incorporating saliency maps on the images of food highlighting the most calorie regions. We also attempt to further improve the accuracy by starting the best models using pre-trained weights on similar tasks of mass estimation and food classification. However, we observe no improvement. Surprisingly, we also find that our best model was not able to surpass the original performance published alongside the test dataset, Nutrition5k. We use ResNet50 and Xception as the base models for our experiment.