arXiv reaDer
状況認識歩行者軌道予測のための自己成長空間グラフネットワーク
Self-Growing Spatial Graph Network for Context-Aware Pedestrian Trajectory Prediction
歩行者の軌道予測は、歩行者の社会的相互作用とそのコンテキストコンプライアンスの正確なモデルを動的な空間グラフに埋め込むために行われた最近の研究で活発な研究分野です。ただし、既存の作品は、シーンとダイナミクスに関する空間的な仮定に依存しているため、未知の環境でグラフ構造をオンラインシステムに適応させるという大きな課題が伴います。さらに、ストリーミングデータの同じ問題に取り組むには、空間的な仮定に依存せずに歩行者の相互作用を表すようにグラフ構造を適応させるという固有の課題が伴います。さらに、予測パフォーマンスに対するリレーショナルモデリングの影響に対する評価アプローチが不足しています。このギャップを埋めるために、コンテキストシーンの特徴と歩行者の視覚的手がかりに基づいたデータ駆動型の適応型オンライン近隣推奨を使用するソーシャルトラジェクトリレコメンダーゲートグラフリカレントネイバーフッドネットワーク(STR-GGRNN)を提案します。近隣の推奨事項は、歩行者の軌道を予測するためのグラフ隣接行列を構築するためのオンライン非負行列因子分解(NMF)によって実現されます。 %andは、予測エラーに対して隣接行列を評価します。 ■広く使用されているデータセットに基づく実験は、私たちの方法が最先端の方法よりも優れていることを示しています。私たちの最高のパフォーマンスモデルは、ETH-UCYデータセットで12cmのADEと約15cmのFDEを達成します。提案された方法は、フレームごとに合計20Kの将来の軌道をサンプリングする場合、わずか0.49秒しかかかりません。
Pedestrian trajectory prediction is an active research area with recent works undertaken to embed accurate models of pedestrians social interactions and their contextual compliance into dynamic spatial graphs. However, existing works rely on spatial assumptions about the scene and dynamics, which entails a significant challenge to adapt the graph structure in unknown environments for an online system. %Additionally, tackling the same problem for streamed data entails the inherent challenge of adapting the graph structure to represent pedestrians interactions without reliance on spatial assumptions. In addition, there is a lack of assessment approach for the relational modeling impact on prediction performance. To fill this gap, we propose Social Trajectory Recommender-Gated Graph Recurrent Neighborhood Network, (STR-GGRNN), which uses data-driven adaptive online neighborhood recommendation based on the contextual scene features and pedestrian visual cues. The neighborhood recommendation is achieved by online Nonnegative Matrix Factorization (NMF) to construct the graph adjacency matrices for predicting the pedestrians' trajectories. %and evaluates the adjacency matrix against prediction errors. s Experiments based on widely-used datasets show that our method outperforms the state-of-the-art. Our best performing model achieves 12 cm ADE and ∼15 cm FDE on ETH-UCY dataset. The proposed method takes only 0.49 seconds when sampling a total of 20K future trajectories per frame.
updated: Fri Dec 11 2020 13:25:58 GMT+0000 (UTC)
published: Fri Dec 11 2020 13:25:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト