arXiv reaDer
ARTEMIS:テキスト明示的マッチングと暗黙的類似性を備えた注意ベースの検索
ARTEMIS: Attention-based Retrieval with Text-Explicit Matching and Implicit Similarity
画像を検索する直感的な方法は、サンプル画像と補足テキストで構成されるクエリを使用することです。前者は検索に豊富で暗黙的なコンテキストを提供しますが、後者は明示的に新しい特性を要求するか、目的のターゲット画像を取得するためにサンプル画像の一部の要素を変更する方法を指定します。現在のアプローチでは、通常、クエリの2つの要素のそれぞれの機能を組み合わせて単一の表現にし、潜在的なターゲット画像の機能と比較することができます。私たちの仕事は、テキストから画像への検索と画像から画像への検索という2つのよく知られた関連するフレームワークのプリズムを通してそれを見ることによって、タスクに新しい光を当てることを目的としています。それらからインスピレーションを得て、各クエリ要素とターゲット画像の特定の関係を活用し、2つの補完的なモダリティ間の仲介を可能にする軽量の注意メカニズムを導き出します。画像とそれに関連する自由形式のテキスト修飾子を使用してクエリを実行し、いくつかの検索ベンチマークでアプローチを検証します。私たちの方法は、以前の作品のように、サイド情報、マルチレベルの機能、重い事前トレーニング、または大規模なアーキテクチャに頼ることなく、最先端の結果を取得します。
An intuitive way to search for images is to use queries composed of an example image and a complementary text. While the first provides rich and implicit context for the search, the latter explicitly calls for new traits, or specifies how some elements of the example image should be changed to retrieve the desired target image. Current approaches typically combine the features of each of the two elements of the query into a single representation, which can then be compared to the ones of the potential target images. Our work aims at shedding new light on the task by looking at it through the prism of two familiar and related frameworks: text-to-image and image-to-image retrieval. Taking inspiration from them, we exploit the specific relation of each query element with the targeted image and derive light-weight attention mechanisms which enable to mediate between the two complementary modalities. We validate our approach on several retrieval benchmarks, querying with images and their associated free-form text modifiers. Our method obtains state-of-the-art results without resorting to side information, multi-level features, heavy pre-training nor large architectures as in previous works.
updated: Tue Mar 15 2022 17:29:20 GMT+0000 (UTC)
published: Tue Mar 15 2022 17:29:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト