arXiv reaDer
VSGM-視覚的なセマンティックグラフを通じてロボットタスクの理解能力を強化します
VSGM -- Enhance robot task understanding ability through visual semantic graph
近年、ロボット工学のためのAIの開発が大きな注目を集めています。ロボットの視覚と言語の相互作用は特に困難です。ロボットに視覚的意味論と言語意味論を理解させることで、推論能力が向上すると考えています。本論文では、セマンティックグラフを使用してより良い視覚画像の特徴を取得し、ロボットの視覚理解能力を向上させる新しい方法であるVSGM(視覚セマンティックグラフメモリ)を提案します。ロボットの事前知識を提供し、画像内のオブジェクトを検出することにより、オブジェクトとオブジェクトの属性間の相関関係を予測し、それらをグラフベースの表現に変換します。画像内のオブジェクトをトップダウンの自己中心的なマップにマッピングします。最後に、現在のタスクの重要なオブジェクトの特徴がグラフニューラルネットワークによって抽出されます。このホワイトペーパーで提案する方法は、ALFRED(現実的な環境と指令からのアクションラーニング)データセットで検証されています。このデータセットでは、ロボットは必要な言語の指示に従って、毎日の屋内家庭用タスクを実行する必要があります。モデルをVSGMに追加すると、タスクの成功率を6〜10%向上させることができます。
In recent years, developing AI for robotics has raised much attention. The interaction of vision and language of robots is particularly difficult. We consider that giving robots an understanding of visual semantics and language semantics will improve inference ability. In this paper, we propose a novel method-VSGM (Visual Semantic Graph Memory), which uses the semantic graph to obtain better visual image features, improve the robot's visual understanding ability. By providing prior knowledge of the robot and detecting the objects in the image, it predicts the correlation between the attributes of the object and the objects and converts them into a graph-based representation; and mapping the object in the image to be a top-down egocentric map. Finally, the important object features of the current task are extracted by Graph Neural Networks. The method proposed in this paper is verified in the ALFRED (Action Learning From Realistic Environments and Directives) dataset. In this dataset, the robot needs to perform daily indoor household tasks following the required language instructions. After the model is added to the VSGM, the task success rate can be improved by 6~10%.
updated: Wed May 19 2021 07:22:31 GMT+0000 (UTC)
published: Wed May 19 2021 07:22:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト