arXiv reaDer
SMARTS 環境におけるマルチエージェントの深層決定論的方策勾配とその説明可能性について
On Multi-Agent Deep Deterministic Policy Gradients and their Explainability for SMARTS Environment
マルチエージェント RL または MARL は、今日の完全自動運転車のリリースを妨げている、自動運転に関する文献の複雑な問題の 1 つです。自動運転における複数のエージェントによる複雑なシナリオの問題を軽減するために、いくつかのシミュレーターが開始されてから反復されています。そのようなシミュレーターの 1 つである SMARTS は、協調的なマルチエージェント学習の重要性について説明しています。この問題について、2 つのアプローチ (MAPPO と MADDPG) について説明します。これらは、ポリシーに基づいた RL アプローチとポリシー外の RL アプローチに基づいています。私たちの結果をこの課題の最先端の結果と比較し、SMARTS 環境でのウェイポイントと併せてこれらのアプローチの説明可能性について議論しながら、改善の可能性がある分野について議論します。
Multi-Agent RL or MARL is one of the complex problems in Autonomous Driving literature that hampers the release of fully-autonomous vehicles today. Several simulators have been in iteration after their inception to mitigate the problem of complex scenarios with multiple agents in Autonomous Driving. One such simulator--SMARTS, discusses the importance of cooperative multi-agent learning. For this problem, we discuss two approaches--MAPPO and MADDPG, which are based on-policy and off-policy RL approaches. We compare our results with the state-of-the-art results for this challenge and discuss the potential areas of improvement while discussing the explainability of these approaches in conjunction with waypoints in the SMARTS environment.
updated: Fri Jan 20 2023 03:17:16 GMT+0000 (UTC)
published: Fri Jan 20 2023 03:17:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト