arXiv reaDer
また来てね?式の理解を参照する際の再クエリ
Come Again? Re-Query in Referring Expression Comprehension
世界の共通認識を構築するために、人間は説明を要求して受け入れることによって誤解を解決する能力に依存しています。ただし、視覚言語モデルを評価する場合、精度などのメトリックは、単一の証拠に基づいて決定を下す必要があるという仮定を強制します。この作業では、モデルが信頼度が低いときにヘルプを要求できるようにすることで、式の理解を参照するタスクのこの仮定を緩和します。このヘルプを提供できる2つの方法を検討します。ユーザーがモデルに追加情報を提供するためにポイントまたはクリックできるマルチモーダル再クエリと、ユーザーが別の参照を提供することのみが許可される言い換え再クエリです。表現。すべてのオブジェクトに最適な参照式を提供すると精度が最大21.9%向上し、この精度は最初の参照式の12%のみを再クエリすることで一致することを示すことにより、再クエリの重要性を示します。さらに、3つの最新のアプローチでマルチモーダル再クエリと言い換え再クエリの両方の再クエリ関数を評価し、平均単一クエリパフォーマンスを最大6.5%向上させ、1.6%近くに収束する言い換え再クエリの組み合わせ置換を示します。単一クエリのパフォーマンスの上限。
To build a shared perception of the world, humans rely on the ability to resolve misunderstandings by requesting and accepting clarifications. However, when evaluating visiolinguistic models, metrics such as accuracy enforce the assumption that a decision must be made based on a single piece of evidence. In this work, we relax this assumption for the task of referring expression comprehension by allowing the model to request help when its confidence is low. We consider two ways in which this help can be provided: multimodal re-query, where the user is allowed to point or click to provide additional information to the model, and rephrase re-query, where the user is only allowed to provide another referring expression. We demonstrate the importance of re-query by showing that providing the best referring expression for all objects can increase accuracy by up to 21.9% and that this accuracy can be matched by re-querying only 12% of initial referring expressions. We further evaluate re-query functions for both multimodal and rephrase re-query across three modern approaches and demonstrate combined replacement for rephrase re-query, which improves average single-query performance by up to 6.5% and converges to as close as 1.6% of the upper bound of single-query performance.
updated: Tue Oct 19 2021 19:01:30 GMT+0000 (UTC)
published: Tue Oct 19 2021 19:01:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト