arXiv reaDer
画像で指定されたオブジェクトへの移動
Navigating to Objects Specified by Images
イメージは、具現化されたエージェントがナビゲートする特定のオブジェクト インスタンスを指定する便利な方法です。このタスクを解決するには、セマンティックな視覚的推論と未知の環境の探索が必要です。シミュレーションと現実世界の両方でこのタスクを実行できるシステムを提示します。私たちのモジュール方式は、探索、目標インスタンスの再識別、目標のローカリゼーション、およびローカル ナビゲーションのサブタスクを解決します。機能マッチングを使用して自己中心的なビジョンで目標インスタンスを再識別し、一致した機能をマップに投影することで目標インスタンスをローカライズします。各サブタスクは、微調整を必要としない既製のコンポーネントを使用して解決されます。 HM3D InstanceImageNav ベンチマークでは、このシステムはベースラインのエンドツーエンド RL ポリシーを 7 倍、最先端の ImageNav モデルを 2.3 倍上回っています (56% 対 25% の成功)。このシステムをモバイル ロボット プラットフォームに展開し、効果的な実世界のパフォーマンスを実証し、家庭とオフィス環境で 88% の成功率を達成しました。
Images are a convenient way to specify which particular object instance an embodied agent should navigate to. Solving this task requires semantic visual reasoning and exploration of unknown environments. We present a system that can perform this task in both simulation and the real world. Our modular method solves sub-tasks of exploration, goal instance re-identification, goal localization, and local navigation. We re-identify the goal instance in egocentric vision using feature-matching and localize the goal instance by projecting matched features to a map. Each sub-task is solved using off-the-shelf components requiring zero fine-tuning. On the HM3D InstanceImageNav benchmark, this system outperforms a baseline end-to-end RL policy 7x and a state-of-the-art ImageNav model 2.3x (56% vs 25% success). We deploy this system to a mobile robot platform and demonstrate effective real-world performance, achieving an 88% success rate across a home and an office environment.
updated: Mon Apr 03 2023 17:58:00 GMT+0000 (UTC)
published: Mon Apr 03 2023 17:58:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト