歩行者の動きを予測することは、人間の行動分析にとって、また安全で効率的な人間とエージェントの相互作用にとって重要です。ただし、大幅な進歩にもかかわらず、既存のアプローチでは、人間のナビゲーションの意思決定の不確実性と多様性を捉えることは依然として困難です。本論文では、人間の軌道予測のための新しいアプローチであるSocialVAEを提案する。 SocialVAEのコアは、確率的リカレントニューラルネットワークを活用して予測を実行する時間的変分オートエンコーダアーキテクチャであり、社会的注意メカニズムと後方後方近似を組み合わせて、歩行者ナビゲーション戦略のより良い抽出を可能にします。 SocialVAEが、ETH / UCYベンチマーク、Stanford Droneデータセット、SportVU NBA移動データセットなど、いくつかの歩行者軌道予測ベンチマークで現在の最先端のパフォーマンスを向上させることを示します。コードはhttps://github.com/xupei0610/SocialVAEで入手できます。
Predicting pedestrian movement is critical for human behavior analysis and also for safe and efficient human-agent interactions. However, despite significant advancements, it is still challenging for existing approaches to capture the uncertainty and multimodality of human navigation decision making. In this paper, we propose SocialVAE, a novel approach for human trajectory prediction. The core of SocialVAE is a timewise variational autoencoder architecture that exploits stochastic recurrent neural networks to perform prediction, combined with a social attention mechanism and a backward posterior approximation to allow for better extraction of pedestrian navigation strategies. We show that SocialVAE improves current state-of-the-art performance on several pedestrian trajectory prediction benchmarks, including the ETH/UCY benchmark, Stanford Drone Dataset, and SportVU NBA movement dataset. Code is available at: https://github.com/xupei0610/SocialVAE.