arXiv reaDer
ESC: ゼロショット オブジェクト ナビゲーションのためのソフト常識制約による探索
ESC: Exploration with Soft Commonsense Constraints for Zero-shot Object Navigation
特定のオブジェクトを正確に見つけてそこに移動する能力は、現実世界で動作し、オブジェクトと対話してタスクを完了する実体エージェントにとって重要な能力です。このようなオブジェクト ナビゲーション タスクは通常、ラベル付けされたオブジェクトを含む視覚環境での大規模なトレーニングを必要とし、未知の環境における新しいオブジェクトへの一般化が不十分です。この研究では、新しいゼロショット オブジェクト ナビゲーション手法であるソフト常識制約 (ESC) を使用した探索を紹介します。これは、ナビゲーション経験や視覚に関するその他のトレーニングを必要とせずに、事前トレーニングされたモデルの常識知識をオープンワールド オブジェクト ナビゲーションに転送します。環境。まず、ESC は、オープンワールドのプロンプトベースのグラウンディングには事前トレーニングされたビジョンと言語モデルを、部屋とオブジェクトの推論には事前トレーニングされた常識言語モデルを活用します。次に、ESC は、効率的な探索のためのソフト ロジック述語としてモデル化することで、常識的な知識をナビゲーション アクションに変換します。 MP3D、HM3D、および RoboTHOR ベンチマークに関する広範な実験により、ESC メソッドがベースラインよりも大幅に向上し、ゼロショット オブジェクト ナビゲーションの新しい最先端の結果が達成されたことが示されています (例: MP3D での CoW より相対成功率が 288% 向上) )。
The ability to accurately locate and navigate to a specific object is a crucial capability for embodied agents that operate in the real world and interact with objects to complete tasks. Such object navigation tasks usually require large-scale training in visual environments with labeled objects, which generalizes poorly to novel objects in unknown environments. In this work, we present a novel zero-shot object navigation method, Exploration with Soft Commonsense constraints (ESC), that transfers commonsense knowledge in pre-trained models to open-world object navigation without any navigation experience nor any other training on the visual environments. First, ESC leverages a pre-trained vision and language model for open-world prompt-based grounding and a pre-trained commonsense language model for room and object reasoning. Then ESC converts commonsense knowledge into navigation actions by modeling it as soft logic predicates for efficient exploration. Extensive experiments on MP3D, HM3D, and RoboTHOR benchmarks show that our ESC method improves significantly over baselines, and achieves new state-of-the-art results for zero-shot object navigation (e.g., 288% relative Success Rate improvement than CoW on MP3D).
updated: Thu Jul 06 2023 06:25:33 GMT+0000 (UTC)
published: Mon Jan 30 2023 18:37:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト