Learning Navigation by Visual Localization and Trajectory Prediction
  運転するとき、人々は現在の交通と希望のルートに基づいて決定を下します。彼らは既知のルートのメンタルマップを持ち、多くの場合、指示を必要とせずにナビゲートできます。現在の自動運転モデルは、追加のGPS情報を使用するときのパフォーマンスを向上させます。ここでは、GPSがなくても自動運転の研究を進め、ルート計画を実行することを目指しています。私たちのシステムは、未加工のビデオストリームと目的地のみが与えられた場合、既知のマップ上で、時間の関数として、リアルタイムの車両の現在位置と将来の軌道を予測することを学習します。 GPS信号はトレーニング時にのみ利用でき、トレーニングデータの注釈は完全に自動化されています。他の公開モデルとは異なり、最大7秒間先の車両の軌道を予測します。これにより、全期間にわたって完全なステアリング、速度、および加速度の情報を導き出すことができます。軌道は、現在のトラフィックや前方の障害物に依存するインスタントステアリングコマンドから、特定の目的地への長期的なナビゲーションの決定まで、複数のレベルでナビゲーション情報をキャプチャします。通常の車とビデオおよびGPSストリームを記録するスマートフォンでデータセットを収集します。 GPSデータを使用して、地上の真実の監視ラベルを導き出し、通過したマップの分析表現を作成します。テストでは、当社のシステムは、視覚的なローカリゼーションとステアリングに関する公開された方法よりも優れており、任意の2つの既知の場所間の正確なナビゲーション支援を提供します。
When driving, people make decisions based on current traffic as well as their desired route. They have a mental map of known routes and are often able to navigate without needing directions. Current self-driving models improve their performances when using additional GPS information. Here we aim to push forward self-driving research and perform route planning even in the absence of GPS. Our system learns to predict in real-time vehicle's current location and future trajectory, as a function of time, on a known map, given only the raw video stream and the intended destination. The GPS signal is available only at training time, with training data annotation being fully automatic. Different from other published models, we predict the vehicle's trajectory for up to seven seconds ahead, from which complete steering, speed and acceleration information can be derived for the entire time span. Trajectories capture navigational information on multiple levels, from instant steering commands that depend on present traffic and obstacles ahead, to longer-term navigation decisions, towards a specific destination. We collect our dataset with a regular car and a smartphone that records video and GPS streams. The GPS data is used to derive ground-truth supervision labels and create an analytical representation of the traversed map. In tests, our system outperforms published methods on visual localization and steering and gives accurate navigation assistance between any two known locations.
