ロボット工学の基本的なタスクは、2 つの場所の間を移動することです。特に、現実世界のナビゲーションでは、高次元の RGB 画像を使用した長期的な計画が必要になる場合があり、これはエンドツーエンドの学習ベースのアプローチにとって大きな課題となります。現在のセミパラメトリック手法は、学習したモジュールと環境のトポロジカル メモリを組み合わせることによって、長期的なナビゲーションを実現します。環境のトポロジカル メモリは、以前に収集された画像に対するグラフとして表されることがよくあります。ただし、これらのグラフを実際に使用するには、多くの枝刈りヒューリスティックを調整する必要があります。これらのヒューリスティックは、偽のエッジを回避し、実行時のメモリ使用量を制限し、大規模な環境で適度に高速なグラフ クエリを維持するために必要です。この研究では、自己教師あり多様体学習を活用して、目標が画像として指定されるグラフフリーのエンドツーエンドのナビゲーション パイプラインを取得する手法である One-4-All (O4A) を紹介します。ナビゲーションは、画像埋め込み上で連続的に定義される潜在的な関数を貪欲に最小化することによって実現されます。私たちのシステムは、RGB データとコントロールの非専門家探索シーケンスでオフラインでトレーニングされており、深度や姿勢の測定は必要ありません。我々は、O4A が 8 つのシミュレートされたギブソン屋内環境で長距離目標を達成できること、またポーズが観察されない場合でも、結果として得られる埋め込みがトポロジー的にグラウンド トゥルース マップと類似していることを示します。さらに、Jackal UGV プラットフォームを使用して実際のナビゲーションが成功することを実証します。
A fundamental task in robotics is to navigate between two locations. In particular, real-world navigation can require long-horizon planning using high-dimensional RGB images, which poses a substantial challenge for end-to-end learning-based approaches. Current semi-parametric methods instead achieve long-horizon navigation by combining learned modules with a topological memory of the environment, often represented as a graph over previously collected images. However, using these graphs in practice requires tuning a number of pruning heuristics. These heuristics are necessary to avoid spurious edges, limit runtime memory usage and maintain reasonably fast graph queries in large environments. In this work, we present One-4-All (O4A), a method leveraging self-supervised and manifold learning to obtain a graph-free, end-to-end navigation pipeline in which the goal is specified as an image. Navigation is achieved by greedily minimizing a potential function defined continuously over image embeddings. Our system is trained offline on non-expert exploration sequences of RGB data and controls, and does not require any depth or pose measurements. We show that O4A can reach long-range goals in 8 simulated Gibson indoor environments and that resulting embeddings are topologically similar to ground truth maps, even if no pose is observed. We further demonstrate successful real-world navigation using a Jackal UGV platform.