データ駆動型シミュレーションは、自動運転アルゴリズムのトレーニングとテストに適した方法になっています。実際の環境を学習済みのシミュレーターに置き換えるというアイデアは、世界モデルのコンテキストでのモデルベースの強化学習でも検討されています。この作業では、データ駆動型の交通シミュレーションが世界モデルとして定式化できることを示します。モーション予測とエンドツーエンドの運転に基づいて構築されたマルチエージェント ポリシーである TrafficBots を提示し、TrafficBots に基づいて、自動運転車の計画モジュール用に調整された世界モデルを取得します。既存のデータ駆動型トラフィック シミュレータには、構成可能性とスケーラビリティが欠けています。構成可能な動作を生成するために、エージェントごとにナビゲーション情報として目的地を導入し、動作スタイルを指定する時不変の潜在的パーソナリティを導入します。スケーラビリティを改善するために、角度の位置エンコーディングの新しいスキームを提示します。これにより、すべてのエージェントが同じベクトル化されたコンテキストを共有し、ドット積の注意に基づくアーキテクチャを使用できるようになります。その結果、密集した都市シナリオで見られるすべてのトラフィック参加者をシミュレートできます。 Waymo のオープン モーション データセットでの実験では、TrafficBots が現実的なマルチエージェントの動作をシミュレートし、モーション予測タスクで優れたパフォーマンスを達成できることが示されています。
Data-driven simulation has become a favorable way to train and test autonomous driving algorithms. The idea of replacing the actual environment with a learned simulator has also been explored in model-based reinforcement learning in the context of world models. In this work, we show data-driven traffic simulation can be formulated as a world model. We present TrafficBots, a multi-agent policy built upon motion prediction and end-to-end driving, and based on TrafficBots we obtain a world model tailored for the planning module of autonomous vehicles. Existing data-driven traffic simulators are lacking configurability and scalability. To generate configurable behaviors, for each agent we introduce a destination as navigational information, and a time-invariant latent personality that specifies the behavioral style. To improve the scalability, we present a new scheme of positional encoding for angles, allowing all agents to share the same vectorized context and the use of an architecture based on dot-product attention. As a result, we can simulate all traffic participants seen in dense urban scenarios. Experiments on the Waymo open motion dataset show TrafficBots can simulate realistic multi-agent behaviors and achieve good performance on the motion prediction task.