自動運転は社会に大きな影響を与えます。安全で快適な運転には、車両の軌道、特に角度と速度を予測することが重要です。この作業は、カメラセンサーと視覚的なマップデータからの入力の融合に焦点を当てており、パフォーマンスの大幅な向上につながり、チャレンジに勝つために重要な役割を果たします。画像フレームの処理に事前に訓練されたCNNを使用し、画像表現と視覚的なマップデータを融合するニューラルネットワークを使用し、時系列予測のためにシーケンスモデルを訓練します。 ICCV 2019 Learning to Driveチャレンジに勝つために、最高のパフォーマンスのMSEアングルと全体的なパフォーマンスを実証します。モデルとコードを公開します。
Autonomous driving has a significant impact on society. Predicting vehicle trajectories, specifically, angle and speed, is important for safe and comfortable driving. This work focuses on fusing inputs from camera sensors and visual map data which lead to significant improvement in performance and plays a key role in winning the challenge. We use pre-trained CNN's for processing image frames, a neural network for fusing the image representation with visual map data, and train a sequence model for time series prediction. We demonstrate the best performing MSE angle and best performance overall, to win the ICCV 2019 Learning to Drive challenge. We make our models and code publicly available.