SGoLAM: Simultaneous Goal Localization and Mapping for Multi-Object Goal Navigation
マルチオブジェクトゴールナビゲーションのためのシンプルで効率的なアルゴリズムである、同時ゴールローカリゼーションとマッピングの略であるSGoLAMを紹介します。 RGB-DカメラとGPS /コンパスセンサーを備えたエージェントを考えると、私たちの目的は、エージェントに現実的な3D環境で一連のターゲットオブジェクトにナビゲートさせることです。私たちのパイプラインは、問題をマッピングと目標のローカリゼーションという2つの主要なコンポーネントに分解することにより、ビジュアルナビゲーションの従来のアプローチの強みを十分に活用しています。マッピングモジュールは深度観測を占有マップに変換し、目標ローカリゼーションモジュールは目標オブジェクトの場所をマークします。エージェントのポリシーは、2つのモジュールによって提供される情報を使用して決定されます。現在の目標が見つかった場合は、目標に向かって計画し、それ以外の場合は探索を実行します。私たちのアプローチはニューラルネットワークのトレーニングを必要としないため、既成の方法で使用でき、新しい目に見えない環境での迅速な一般化に適しています。それにもかかわらず、私たちのアプローチは、最先端の学習ベースのアプローチと同等に機能します。 SGoLAMは、CVPR 2021 MultiON(Multi-Object Goal Navigation)チャレンジで2位にランクされています。コードはで公開されています。
We present SGoLAM, short for simultaneous goal localization and mapping, which is a simple and efficient algorithm for Multi-Object Goal navigation. Given an agent equipped with an RGB-D camera and a GPS/Compass sensor, our objective is to have the agent navigate to a sequence of target objects in realistic 3D environments. Our pipeline fully leverages the strength of classical approaches for visual navigation, by decomposing the problem into two key components: mapping and goal localization. The mapping module converts the depth observations into an occupancy map, and the goal localization module marks the locations of goal objects. The agent's policy is determined using the information provided by the two modules: if a current goal is found, plan towards the goal and otherwise, perform exploration. As our approach does not require any training of neural networks, it could be used in an off-the-shelf manner, and amenable for fast generalization in new, unseen environments. Nonetheless, our approach performs on par with the state-of-the-art learning-based approaches. SGoLAM is ranked 2nd in the CVPR 2021 MultiON (Multi-Object Goal Navigation) challenge. We have made our code publicly available at
updated: Thu Oct 14 2021 06:15:14 GMT+0000 (UTC)
published: Thu Oct 14 2021 06:15:14 GMT+0000 (UTC)
