探索が事前に定義された時間によって制限される、これまで目に見えなかった環境での時間制限のあるロボット探索の問題を検討します。学習によって強化されたモデルベースの計画を使用した新しい探索アプローチを提案します。現在のマップ上のフロンティアに関連付けられた一連のサブゴールを生成し、これらのサブゴールを使用して探索するためのベルマン方程式を導き出します。屋内シーンの視覚センシングとセマンティック マッピングの進歩は、深層畳み込みニューラル ネットワークをトレーニングして、各フロンティアに関連付けられたプロパティを推定するために活用されます。つまり、フロンティアを超えた予想される観測されていない領域と、それを探索するために必要な予想される時間ステップ (離散化されたアクション) です。提案されたモデルベースのプランナーは、時間が許せばシーン全体を探索することが保証されています。ハビタット シミュレータを使用して、大規模な疑似現実的な屋内データセット (Matterport3D) に対するアプローチを徹底的に評価します。私たちのアプローチを古典的およびより最近のRLベースの探索方法と比較し、いくつかの設定でその明確な利点を示しています。
We consider the problem of time-limited robotic exploration in previously unseen environments where exploration is limited by a predefined amount of time. We propose a novel exploration approach using learning-augmented model-based planning. We generate a set of subgoals associated with frontiers on the current map and derive a Bellman Equation for exploration with these subgoals. Visual sensing and advances in semantic mapping of indoor scenes are exploited for training a deep convolutional neural network to estimate properties associated with each frontier: the expected unobserved area beyond the frontier and the expected timesteps (discretized actions) required to explore it. The proposed model-based planner is guaranteed to explore the whole scene if time permits. We thoroughly evaluate our approach on a large-scale pseudo-realistic indoor dataset (Matterport3D) with the Habitat simulator. We compare our approach with classical and more recent RL-based exploration methods, demonstrating its clear advantages in several settings.