arXiv reaDer
Grouptron:グループを意識した密集した群集軌道予測のための動的マルチスケールグラフ畳み込みネットワーク
Grouptron: Dynamic Multi-Scale Graph Convolutional Networks for Group-Aware Dense Crowd Trajectory Forecasting
非常にダイナミックでインタラクティブなシーンでの歩行者の軌道の正確で長期的な予測は、長年の課題です。データ駆動型アプローチの使用における最近の進歩により、予測精度の点で大幅な改善が達成されました。ただし、グループ対応の分析がないため、予測モデルのパフォーマンスが制限されています。これは、歩行者がグループで移動し、グループ間の相互作用が非常に複雑で動的である、非常に混雑したシーンでは特に無視できません。この論文では、歩行者グループの検出を活用し、シーンの理解と表現を向上させるために個人レベル、グループレベル、およびシーンレベルの情報を利用するマルチスケール動的予測フレームワークであるGrouptronを紹介します。私たちのアプローチは、歩行者グループを識別するために時空間クラスタリングアルゴリズムを採用し、個人、グループ、およびシーンレベルで時空間グラフを作成します。次に、グラフニューラルネットワークを使用して、さまざまなスケールでダイナミクスをエンコードし、軌道予測のために埋め込みを集約します。私たちは、私たちのアプローチの有効性を実証するために、広範な比較とアブレーション実験を実施しました。私たちの方法は、ETH / UCYベンチマークデータセットの最先端の方法と比較して、最終変位誤差(FDE)を9.3%減少させ、広範な人間グループの相互作用がより頻繁に存在するより混雑したシーンでFDEを16.1%減少させます。
Accurate, long-term forecasting of pedestrian trajectories in highly dynamic and interactive scenes is a long-standing challenge. Recent advances in using data-driven approaches have achieved significant improvements in terms of prediction accuracy. However, the lack of group-aware analysis has limited the performance of forecasting models. This is especially nonnegligible in highly crowded scenes, where pedestrians are moving in groups and the interactions between groups are extremely complex and dynamic. In this paper, we present Grouptron, a multi-scale dynamic forecasting framework that leverages pedestrian group detection and utilizes individual-level, group-level and scene-level information for better understanding and representation of the scenes. Our approach employs spatio-temporal clustering algorithms to identify pedestrian groups, creates spatio-temporal graphs at the individual, group, and scene levels. It then uses graph neural networks to encode dynamics at different scales and aggregate the embeddings for trajectory prediction. We conducted extensive comparisons and ablation experiments to demonstrate the effectiveness of our approach. Our method achieves 9.3% decrease in final displacement error (FDE) compared with state-of-the-art methods on ETH/UCY benchmark datasets, and 16.1% decrease in FDE in more crowded scenes where extensive human group interactions are more frequently present.
updated: Fri Mar 04 2022 22:07:37 GMT+0000 (UTC)
published: Wed Sep 29 2021 01:22:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト