Potential Field: Interpretable and Unified Representation for Trajectory Prediction
 動きの複雑な刺激(環境/慣性/社会)を考えると、エージェントの将来の軌跡を予測することは困難な作業です。これまでの研究では、さまざまなモジュールから個々の刺激を学習し、エンドツーエンドの方法で表現を融合しているため、実際にキャプチャーされたものと融合された方法を理解することは困難です。この研究では、すべての刺激をモデル化するための解釈可能な統一された表現として、物理学から潜在場の概念を借用します。これにより、中間学習プロセスを監督するだけでなく、さまざまなソースの情報を融合するための一貫した方法を持つことができます。生成されたポテンシャル場から、将来の動きの方向と速度をさらに推定します。これは、問題のマルチモーダルな性質を説明するためにガウス分布としてモデル化されます。最終的な予測結果は、推定された動きの方向と速度に基づいて過去の位置を繰り返し移動することにより生成されます。 ETH、UCY、およびスタンフォードドローンのデータセットに関する最新の結果を示します。
Predicting an agent's future trajectory is a challenging task given the complicated stimuli (environmental/inertial/social) of motion. Prior works learn individual stimulus from different modules and fuse the representations in an end-to-end manner, which makes it hard to understand what are actually captured and how they are fused. In this work, we borrow the notion of potential field from physics as an interpretable and unified representation to model all stimuli. This allows us to not only supervise the intermediate learning process, but also have a coherent method to fuse the information of different sources. From the generated potential fields, we further estimate future motion direction and speed, which are modeled as Gaussian distributions to account for the multi-modal nature of the problem. The final prediction results are generated by recurrently moving past location based on the estimated motion direction and speed. We show state-of-the-art results on the ETH, UCY, and Stanford Drone datasets.
updated: Tue Apr 07 2020 21:46:07 GMT+0000 (UTC)
published: Mon Nov 18 2019 04:00:34 GMT+0000 (UTC)
