人間は、方向性経路または車線として表される相互に既知のナビゲーション パターンを順守することにより、規則に制約された環境を協調的にナビゲートします。不完全に観察された環境からこれらのナビゲーション パターンを推測することは、マッピングされていない場所で動作するインテリジェント モバイル ロボットに必要です。ただし、これらのナビゲーション パターンをアルゴリズムで定義することは簡単ではありません。この論文では、部分的な観測のみから現実世界の環境でのナビゲーション パターンを推測することを学習するための、最初の自己教師あり学習 (SSL) メソッドを紹介します。幾何学的データ拡張、予測世界モデリング、および情報理論正則化により、モデルが無限データの限界で偏りのないローカル方向性ソフトレーン確率 (DSLP) フィールドを予測できるようになる方法について説明します。最尤グラフを DSLP フィールドに当てはめることで、グローバル ナビゲーション パターンを推測する方法を示します。実験では、nuScenes データセットで、SSL モデルが 2 つの SOTA 教師ありレーン グラフ予測モデルよりも優れていることが示されています。知覚によるナビゲーションのためのスケーラブルで解釈可能な継続的な学習パラダイムとして、SSL メソッドを提案します。公開時にコードがリリースされました。
Human beings cooperatively navigate rule-constrained environments by adhering to mutually known navigational patterns, which may be represented as directional pathways or road lanes. Inferring these navigational patterns from incompletely observed environments is required for intelligent mobile robots operating in unmapped locations. However, algorithmically defining these navigational patterns is nontrivial. This paper presents the first self-supervised learning (SSL) method for learning to infer navigational patterns in real-world environments from partial observations only. We explain how geometric data augmentation, predictive world modeling, and an information-theoretic regularizer enables our model to predict an unbiased local directional soft lane probability (DSLP) field in the limit of infinite data. We demonstrate how to infer global navigational patterns by fitting a maximum likelihood graph to the DSLP field. Experiments show that our SSL model outperforms two SOTA supervised lane graph prediction models on the nuScenes dataset. We propose our SSL method as a scalable and interpretable continual learning paradigm for navigation by perception. Code released upon publication.