arXiv reaDer
強化学習コーチを模倣することによるエンドツーエンドの都市運転
End-to-End Urban Driving by Imitating a Reinforcement Learning Coach
自動運転へのエンドツーエンドのアプローチは、一般的に専門家のデモンストレーションに依存しています。人間は優れたドライバーですが、ポリシーに基づいた綿密な監視を必要とするエンドツーエンドのアルゴリズムの優れた指導者ではありません。それどころか、特権情報を活用する自動化された専門家は、大規模なオンポリシーおよびオフポリシーのデモンストレーションを効率的に生成できます。ただし、都市運転の既存の自動化された専門家は、手作りのルールを多用し、グラウンドトゥルース情報が利用可能なドライビングシミュレーターでも最適に機能しません。これらの問題に対処するために、鳥瞰図画像を継続的な低レベルのアクションにマッピングする強化学習の専門家をトレーニングします。 CARLAに新しいパフォーマンスの上限を設定する一方で、私たちの専門家は、模倣学習エージェントが学習するための有益な監督信号を提供する優れたコーチでもあります。強化学習コーチの監督下で、単眼カメラ入力を備えたベースラインのエンドツーエンドエージェントがエキスパートレベルのパフォーマンスを実現します。私たちのエンドツーエンドのエージェントは、NoCrash-denseベンチマークで新しい町と新しい天気に一般化し、より挑戦的なCARLA LeaderBoardで最先端のパフォーマンスを実現しながら、78%の成功率を達成します。
End-to-end approaches to autonomous driving commonly rely on expert demonstrations. Although humans are good drivers, they are not good coaches for end-to-end algorithms that demand dense on-policy supervision. On the contrary, automated experts that leverage privileged information can efficiently generate large scale on-policy and off-policy demonstrations. However, existing automated experts for urban driving make heavy use of hand-crafted rules and perform suboptimally even on driving simulators, where ground-truth information is available. To address these issues, we train a reinforcement learning expert that maps bird's-eye view images to continuous low-level actions. While setting a new performance upper-bound on CARLA, our expert is also a better coach that provides informative supervision signals for imitation learning agents to learn from. Supervised by our reinforcement learning coach, a baseline end-to-end agent with monocular camera-input achieves expert-level performance. Our end-to-end agent achieves a 78% success rate while generalizing to a new town and new weather on the NoCrash-dense benchmark and state-of-the-art performance on the more challenging CARLA LeaderBoard.
updated: Wed Aug 18 2021 17:36:51 GMT+0000 (UTC)
published: Wed Aug 18 2021 17:36:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト