arXiv reaDer
CLEVR3D:3D実世界シーンでの質問応答のための構成言語と初歩的な視覚的推論
CLEVR3D: Compositional Language and Elementary Visual Reasoning for Question Answering in 3D Real-World Scenes
3Dシーンの理解は、比較的新しい研究分野です。このホワイトペーパーでは、3D実世界のシーン(VQA-3D)での視覚的な質問応答タスクを紹介します。これは、3Dシーンで考えられるすべての質問に答えることを目的としています。この問題に取り組むために、最初のVQA-3Dデータセット、つまりCLEVR3Dが提案されています。これには、1,129の実世界のシーンで60Kの質問が含まれています。具体的には、3Dシーングラフ構造を活用して、オブジェクトの属性(サイズ、色、素材など)とそれらの空間的関係の質問をカバーするさまざまな推論質問を生成する質問エンジンを開発します。このデータセットに基づいて、最初のVQA-3DベースラインモデルであるTransVQA3Dをさらに設計します。 TransVQA3Dモデルは、適切に設計されたTransformerアーキテクチャを採用して、純粋な言語ベースラインおよび3Dシナリオに直接適用された以前の3D推論方法と比較して、優れたVQA-3Dパフォーマンスを実現します。実験結果は、VQA-3Dを補助タスクとして使用することで、ノードごとの分類やグラフ全体の認識のためのシーングラフ分析など、3Dシーン理解のパフォーマンスを向上できることを確認しています。
3D scene understanding is a relatively emerging research field. In this paper, we introduce the Visual Question Answering task in 3D real-world scenes (VQA-3D), which aims to answer all possible questions given a 3D scene. To tackle this problem, the first VQA-3D dataset, namely CLEVR3D, is proposed, which contains 60K questions in 1,129 real-world scenes. Specifically, we develop a question engine leveraging 3D scene graph structures to generate diverse reasoning questions, covering the questions of objects' attributes (i.e., size, color, and material) and their spatial relationships. Built upon this dataset, we further design the first VQA-3D baseline model, TransVQA3D. The TransVQA3D model adopts well-designed Transformer architectures to achieve superior VQA-3D performance, compared with the pure language baseline and previous 3D reasoning methods directly applied to 3D scenarios. Experimental results verify that taking VQA-3D as an auxiliary task can boost the performance of 3D scene understanding, including scene graph analysis for the node-wise classification and whole-graph recognition.
updated: Wed Dec 22 2021 06:43:21 GMT+0000 (UTC)
published: Wed Dec 22 2021 06:43:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト