arXiv reaDer
ロボット操作タスクを理解するためのコンテキストセマンティクスによる視覚知覚の橋渡し
Bridging Visual Perception with Contextual Semantics for Understanding Robot Manipulation Tasks
操作シナリオを理解することで、インテリジェントロボットは操作タスクを正常に完了するための適切なアクションを計画できます。インテリジェントロボットは、エンティティ、関係、属性を構造的に記述することにより、操作知識を意味的に解釈することが不可欠です。このペーパーでは、ビデオクリップから高レベルの概念的な動的知識グラフを生成するための実装フレームワークを提案します。視覚認識とコンテキストセマンティクスに対応するビジョン言語モデルとオントロジーシステムの組み合わせを使用して、Entity-Relation-Entity(E-R-E)およびEntity-Attribute-Value(E-A-V)タプルでロボット操作の知識を表現します。提案された方法は、柔軟で精通しています。フレームワークを使用して、ロボットがキッチン環境で操作アクションを実行するケーススタディを提示し、生成された動的知識グラフを使用して、視覚とコンテキストセマンティクスを橋渡しします。
Understanding manipulation scenarios allows intelligent robots to plan for appropriate actions to complete a manipulation task successfully. It is essential for intelligent robots to semantically interpret manipulation knowledge by describing entities, relations and attributes in a structural manner. In this paper, we propose an implementing framework to generate high-level conceptual dynamic knowledge graphs from video clips. A combination of a Vision-Language model and an ontology system, in correspondence with visual perception and contextual semantics, is used to represent robot manipulation knowledge with Entity-Relation-Entity (E-R-E) and Entity-Attribute-Value (E-A-V) tuples. The proposed method is flexible and well-versed. Using the framework, we present a case study where robot performs manipulation actions in a kitchen environment, bridging visual perception with contextual semantics using the generated dynamic knowledge graphs.
updated: Sun Jul 26 2020 11:15:04 GMT+0000 (UTC)
published: Mon Sep 16 2019 20:06:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト