arXiv reaDer
CADRE:視覚ベースの自律都市運転のためのカスケード深層強化学習フレームワーク
CADRE: A Cascade Deep Reinforcement Learning Framework for Vision-based Autonomous Urban Driving
複雑な都市環境と運転行動のダイナミクスのため、密集した交通における視覚ベースの自律的な都市運転は非常に困難です。広く適用されている方法は、手作りのルールに大きく依存しているか、限られた人間の経験から学ぶため、まれではあるが重要なシナリオに一般化することは困難です。この論文では、モデルフリーの視覚ベースの自律都市運転を実現するための、新しいCAscade DeepREinforcement学習フレームワークCADREを紹介します。 CADREでは、生の観察から代表的な潜在的特徴を導き出すために、最初に、共同注意メカニズムを活用して事前に収集された運転から視覚情報と制御情報の間の相互関係を学習する共同注意知覚モジュール(CoPM)をオフライントレーニングします。データセット。次に、凍結されたCoPMによってカスケードされ、特別に設計された報酬関数のガイダンスの下で運転ポリシーをオンラインで学習するための効率的な分散型近位ポリシー最適化フレームワークを提示します。 CARLA NoCrashベンチマークと、自律的な都市の運転タスクにおける特定の障害物回避シナリオを使用して、包括的な実証的研究を実行します。実験結果は、CADREの有効性と最先端技術に対するその優位性を大幅に正当化しています。
Vision-based autonomous urban driving in dense traffic is quite challenging due to the complicated urban environment and the dynamics of the driving behaviors. Widely-applied methods either heavily rely on hand-crafted rules or learn from limited human experience, which makes them hard to generalize to rare but critical scenarios. In this paper, we present a novel CAscade Deep REinforcement learning framework, CADRE, to achieve model-free vision-based autonomous urban driving. In CADRE, to derive representative latent features from raw observations, we first offline train a Co-attention Perception Module (CoPM) that leverages the co-attention mechanism to learn the inter-relationships between the visual and control information from a pre-collected driving dataset. Cascaded by the frozen CoPM, we then present an efficient distributed proximal policy optimization framework to online learn the driving policy under the guidance of particularly designed reward functions. We perform a comprehensive empirical study with the CARLA NoCrash benchmark as well as specific obstacle avoidance scenarios in autonomous urban driving tasks. The experimental results well justify the effectiveness of CADRE and its superiority over the state-of-the-art by a wide margin.
updated: Wed Apr 19 2023 15:24:35 GMT+0000 (UTC)
published: Thu Feb 17 2022 10:07:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト