視覚的ナビゲーション方法の進歩により、生のRGB画像から意味のある表現を学習し、構造的および意味論的推論を含むさまざまなタスクを実行できるインテリジェントな具体化されたナビゲーションエージェントが生まれました。ただし、ほとんどの学習ベースのナビゲーションポリシーは、シミュレーション環境でトレーニングおよびテストされています。これらのポリシーが実際に役立つためには、実際のポリシーに転送する必要があります。本論文では、視覚ナビゲーションのための教師なしドメイン適応法を提案する。私たちの方法は、変換がナビゲーションポリシーによって学習された表現と一致するように、ターゲットドメインの画像をソースドメインに変換します。提案された方法は、シミュレーションにおける2つの異なるナビゲーションタスク全体でいくつかのベースラインを上回っています。さらに、シミュレーションで学習したナビゲーションポリシーを実世界に転送するために、この方法を使用できることを示します。
Advances in visual navigation methods have led to intelligent embodied navigation agents capable of learning meaningful representations from raw RGB images and perform a wide variety of tasks involving structural and semantic reasoning. However, most learning-based navigation policies are trained and tested in simulation environments. In order for these policies to be practically useful, they need to be transferred to the real-world. In this paper, we propose an unsupervised domain adaptation method for visual navigation. Our method translates the images in the target domain to the source domain such that the translation is consistent with the representations learned by the navigation policy. The proposed method outperforms several baselines across two different navigation tasks in simulation. We further show that our method can be used to transfer the navigation policies learned in simulation to the real world.