arXiv reaDer
オブジェクトの視覚的ナビゲーションのためのエージェント中心位グラフ
Agent-Centric Relation Graph for Object Visual Navigation
オブジェクトの視覚的ナビゲーションは、エージェントの視覚的観察に基づいて、エージェントをターゲットオブジェクトに向けて誘導することを目的としています。環境を合理的に認識し、エージェントを正確に制御することが非常に望ましい。ナビゲーションタスクでは、環境内の関係に基づいて視覚的表現を学習するためのエージェント中心位グラフ(ACRG)を紹介します。 ACRGは、オブジェクト間の関係とエージェントとターゲット間の関係という2つの関係で構成される、非常に効果的で合理的な構造です。一方では、オブジェクト間の相対的な水平位置を格納するオブジェクト水平関係グラフ(OHRG)を設計します。垂直関係はOHRGに関与していないことに注意してください。また、OHRGが制御戦略に適していると主張します。一方、エージェントがターゲットまでの距離を認識できるようにするエージェント-ターゲット深度関係グラフ(ATDRG)を提案します。 ATDRGを実現するために、画像の奥行きを利用して距離を表します。上記の関係が与えられると、エージェントは環境を認識し、ナビゲーションアクションを出力できます。 ACRGと位置エンコードされたグローバル機能によって構築された視覚的表現が与えられると、エージェントはナビゲーションアクションを実行するためにターゲット位置をキャプチャできます。人工環境AI2-Thorでの実験結果は、ACRGが目に見えないテスト環境で他の最先端の方法を大幅に上回っていることを示しています。
Object visual navigation aims to steer an agent towards a target object based on visual observations of the agent. It is highly desirable to reasonably perceive the environment and accurately control the agent. In the navigation task, we introduce an Agent-Centric Relation Graph (ACRG) for learning the visual representation based on the relationships in the environment. ACRG is a highly effective and reasonable structure that consists of two relationships, i.e., the relationship among objects and the relationship between the agent and the target. On the one hand, we design the Object Horizontal Relationship Graph (OHRG) that stores the relative horizontal location among objects. Note that the vertical relationship is not involved in OHRG, and we argue that OHRG is suitable for the control strategy. On the other hand, we propose the Agent-Target Depth Relationship Graph (ATDRG) that enables the agent to perceive the distance to the target. To achieve ATDRG, we utilize image depth to represent the distance. Given the above relationships, the agent can perceive the environment and output navigation actions. Given the visual representations constructed by ACRG and position-encoded global features, the agent can capture the target position to perform navigation actions. Experimental results in the artificial environment AI2-Thor demonstrate that ACRG significantly outperforms other state-of-the-art methods in unseen testing environments.
updated: Mon Nov 29 2021 10:06:31 GMT+0000 (UTC)
published: Mon Nov 29 2021 10:06:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト