arXiv reaDer
CHEF:食品ドメイン検索のためのクロスモーダル階層埋め込み
CHEF: Cross-modal Hierarchical Embeddings for Food Domain Retrieval
画像とテキストのペアなどのマルチモーダルデータが豊富にあるにもかかわらず、これらのデータインスタンスの構築における個々のエンティティとそれらのさまざまな役割を理解するための努力はほとんどありませんでした。この作業では、視覚と言語の関連性の問題として、エンティティとそれに対応する料理レシピの重要性を自動的に発見するよう努めます。より具体的には、食品の画像とレシピの関連付けおよび検索タスクにおける画像とテキストの潜在的な表現を共同でモデル化するための新しいクロスモーダル学習フレームワークを紹介します。このモデルにより、画像とテキストの間、およびタイトル、材料、調理手順などのレシピのテキスト部分の間で、複雑な機能的および階層的な関係を発見できます。私たちの実験は、計算クロスモーダル検索フレームワークのテキストエンコーダーとして効率的なツリー構造の長短期記憶を利用することにより、明示的な監督なしにレシピの説明で主要な成分と調理動作を特定できるだけではないことを示しています、しかし、クロスモーダル検索やレシピ適応タスクに挑戦するのに適した、食品レシピのより意味のある特徴表現を学ぶこともできます。
Despite the abundance of multi-modal data, such as image-text pairs, there has been little effort in understanding the individual entities and their different roles in the construction of these data instances. In this work, we endeavour to discover the entities and their corresponding importance in cooking recipes automaticall} as a visual-linguistic association problem. More specifically, we introduce a novel cross-modal learning framework to jointly model the latent representations of images and text in the food image-recipe association and retrieval tasks. This model allows one to discover complex functional and hierarchical relationships between images and text, and among textual parts of a recipe including title, ingredients and cooking instructions. Our experiments show that by making use of efficient tree-structured Long Short-Term Memory as the text encoder in our computational cross-modal retrieval framework, we are not only able to identify the main ingredients and cooking actions in the recipe descriptions without explicit supervision, but we can also learn more meaningful feature representations of food recipes, appropriate for challenging cross-modal retrieval and recipe adaption tasks.
updated: Thu Feb 04 2021 11:24:34 GMT+0000 (UTC)
published: Thu Feb 04 2021 11:24:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト