arXiv reaDer
身体化されたビジョンのコアチャレンジ-言語計画
Core Challenges in Embodied Vision-Language Planning
マルチモーダル機械学習と人工知能(AI)の分野における最近の進歩により、コンピュータービジョン、自然言語処理、および具体化されたAIの交差点で困難なタスクが開発されています。多くのアプローチと以前の調査の追求がこれらの次元の1つまたは2つを特徴づけましたが、3つすべての中心で全体的な分析はありませんでした。さらに、これらのトピックの組み合わせを検討する場合でも、フィールドの高レベルの課題と機会を示すのではなく、たとえば現在のアーキテクチャ手法を説明することに重点が置かれます。この調査論文では、コンピュータビジョンと自然言語を共同で使用する著名な具体化されたナビゲーションと操作の問題のファミリーである具体化されたビジョン-言語計画(EVLP)タスクについて説明します。これらのタスクを統合し、新しいアルゴリズムアプローチと現在のアルゴリズムアプローチ、メトリック、シミュレートされた環境、およびEVLPタスクに使用されるデータセットの詳細な分析と比較を提供する分類法を提案します。最後に、新しいEVLP作業で対処する必要があると考えられる主要な課題を提示し、モデルの一般化を可能にし、実際の展開を促進するタスク構築を提唱します。
Recent advances in the areas of multimodal machine learning and artificial intelligence (AI) have led to the development of challenging tasks at the intersection of Computer Vision, Natural Language Processing, and Embodied AI. Whereas many approaches and previous survey pursuits have characterised one or two of these dimensions, there has not been a holistic analysis at the center of all three. Moreover, even when combinations of these topics are considered, more focus is placed on describing, e.g., current architectural methods, as opposed to also illustrating high-level challenges and opportunities for the field. In this survey paper, we discuss Embodied Vision-Language Planning (EVLP) tasks, a family of prominent embodied navigation and manipulation problems that jointly use computer vision and natural language. We propose a taxonomy to unify these tasks and provide an in-depth analysis and comparison of the new and current algorithmic approaches, metrics, simulated environments, as well as the datasets used for EVLP tasks. Finally, we present the core challenges that we believe new EVLP works should seek to address, and we advocate for task construction that enables model generalizability and furthers real-world deployment.
updated: Sat Jan 22 2022 00:47:45 GMT+0000 (UTC)
published: Sat Jun 26 2021 05:18:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト