arXiv reaDer
MetaCLUE: 包括的な視覚メタファー研究に向けて
MetaCLUE: Towards Comprehensive Visual Metaphors Research
創造性は人間の認識に不可欠な部分であり、世界を理解する方法に固有の部分でもあります。比喩的な抽象化は、感情などの抽象的な概念間の微妙な関係を通じて創造的なアイデアを伝える上で基本となります。コンピューター ビジョンのベンチマークとアプローチは、主に画像の文字通りの解釈を理解して生成することに重点を置いていますが、画像の比喩的な理解は比較的未踏のままです。この目標に向けて、視覚的な比喩に関する一連のビジョン タスクである MetaCLUE を紹介します。また、これらのタスクの評価を容易にするデータセットが存在しないため、高品質で豊富なメタファー アノテーション (抽象オブジェクト、概念、関係、およびそれらに対応するオブジェクト ボックス) も収集します。私たちは、注釈に基づいてビジョンと言語の最先端モデルの包括的な分析を行い、視覚的なメタファー分類、ローカリゼーション、理解 (検索、質問応答、キャプション) および gEneration (テキスト) における現在のアプローチの長所と短所を強調します。 -to-image 合成) タスク。この作業が、人間のような創造力を備えた AI システムの開発に向けた具体的な一歩になることを願っています。
Creativity is an indispensable part of human cognition and also an inherent part of how we make sense of the world. Metaphorical abstraction is fundamental in communicating creative ideas through nuanced relationships between abstract concepts such as feelings. While computer vision benchmarks and approaches predominantly focus on understanding and generating literal interpretations of images, metaphorical comprehension of images remains relatively unexplored. Towards this goal, we introduce MetaCLUE, a set of vision tasks on visual metaphor. We also collect high-quality and rich metaphor annotations (abstract objects, concepts, relationships along with their corresponding object boxes) as there do not exist any datasets that facilitate the evaluation of these tasks. We perform a comprehensive analysis of state-of-the-art models in vision and language based on our annotations, highlighting strengths and weaknesses of current approaches in visual metaphor Classification, Localization, Understanding (retrieval, question answering, captioning) and gEneration (text-to-image synthesis) tasks. We hope this work provides a concrete step towards developing AI systems with human-like creative capabilities.
updated: Mon Apr 24 2023 18:44:56 GMT+0000 (UTC)
published: Mon Dec 19 2022 22:41:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト