arXiv reaDer
現実世界のオブジェクトへの移動
Navigating to Objects in the Real World
家庭、学校、病院などの制御されていない環境にモバイル ロボットを展開するには、セマンティック ナビゲーションが必要です。深さセンサーを使用して幾何学的マップを構築し、ポイントの目標に到達するための計画を立てる空間ナビゲーションの古典的なパイプラインの意味理解の欠如に対応して、多くの学習ベースのアプローチが提案されています。大まかに言えば、エンドツーエンドの学習アプローチは、ディープ ニューラル ネットワークを使用してセンサー入力をアクションに反応的にマッピングします。一方、モジュラー学習アプローチは、学習ベースのセマンティック センシングと探索によって従来のパイプラインを強化します。しかし、学習されたビジュアル ナビゲーション ポリシーは、主にシミュレーションで評価されてきました。さまざまなクラスのメソッドがロボットでどの程度うまく機能するか?以前の経験、地図、または機器を使用せずに、6 つの家庭で古典的、モジュール式、およびエンドツーエンドの学習アプローチの代表的な方法を比較するセマンティック ビジュアル ナビゲーション方法の大規模な実証的研究を提示します。モジュラー学習は現実の世界でうまく機能し、90% の成功率を達成していることがわかりました。対照的に、エンドツーエンドの学習はそうではなく、シミュレーションと現実の間の大きな画像ドメインのギャップにより、77% のシミュレーションから 23% の実際の成功率に低下します。実践者にとって、モジュラー学習がオブジェクトにナビゲートするための信頼できるアプローチであることを示します。ポリシー設計のモジュール性と抽象化により、Sim-to-Real 転送が可能になります。研究者向けに、今日のシミュレーターが信頼できる評価ベンチマークとなることを妨げる 2 つの重要な問題を特定し、(A) 画像の Sim-to-Real ギャップが大きいこと、および (B) シミュレーションと現実世界のエラー モードの間の断絶 - を特定し、具体的な手順を提案します。前方。
Semantic navigation is necessary to deploy mobile robots in uncontrolled environments like our homes, schools, and hospitals. Many learning-based approaches have been proposed in response to the lack of semantic understanding of the classical pipeline for spatial navigation, which builds a geometric map using depth sensors and plans to reach point goals. Broadly, end-to-end learning approaches reactively map sensor inputs to actions with deep neural networks, while modular learning approaches enrich the classical pipeline with learning-based semantic sensing and exploration. But learned visual navigation policies have predominantly been evaluated in simulation. How well do different classes of methods work on a robot? We present a large-scale empirical study of semantic visual navigation methods comparing representative methods from classical, modular, and end-to-end learning approaches across six homes with no prior experience, maps, or instrumentation. We find that modular learning works well in the real world, attaining a 90% success rate. In contrast, end-to-end learning does not, dropping from 77% simulation to 23% real-world success rate due to a large image domain gap between simulation and reality. For practitioners, we show that modular learning is a reliable approach to navigate to objects: modularity and abstraction in policy design enable Sim-to-Real transfer. For researchers, we identify two key issues that prevent today's simulators from being reliable evaluation benchmarks - (A) a large Sim-to-Real gap in images and (B) a disconnect between simulation and real-world error modes - and propose concrete steps forward.
updated: Fri Dec 02 2022 01:10:47 GMT+0000 (UTC)
published: Fri Dec 02 2022 01:10:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト