Learning Sparse Interaction Graphs of Partially Observed Pedestrians for Trajectory Prediction
複数の歩行者の軌道予測は、構造化されていない環境で群衆と相互作用する自律システムの不可欠な安全要素です。最近の多くの取り組みにより、歩行者の動きの背後にある社会的規範を理解することに焦点を当てた軌道予測アルゴリズムが開発されました。しかし、これらの作業は通常、ロボットアプリケーションにスムーズに適用されないようにする2つの仮定を持っていることがわかります。すべての歩行者の位置が一貫して追跡されます。ターゲットエージェントは、シーン内のすべての歩行者に注意を払います。最初の仮定は、不完全な歩行者データを使用した偏った相互作用モデリングにつながり、2番目の仮定は、不必要な外乱をもたらし、ロボットの凍結の問題につながります。したがって、エッジガンベルセレクターが各タイムステップで部分的に観察された歩行者のまばらな相互作用グラフをサンプリングするガンベルソーシャルトランスフォーマーを提案します。 Node TransformerEncoderとMaskedLSTMは、軌道を予測するために、サンプリングされたスパースグラフを使用して歩行者の特徴をエンコードします。私たちのモデルが仮定によって引き起こされる潜在的な問題を克服し、私たちのアプローチがベンチマーク評価で関連する作業よりも優れていることを示します。
Multi-pedestrian trajectory prediction is an indispensable safety element of autonomous systems that interact with crowds in unstructured environments. Many recent efforts have developed trajectory prediction algorithms with focus on understanding social norms behind pedestrian motions. Yet we observe these works usually hold two assumptions that prevent them from being smoothly applied to robot applications: positions of all pedestrians are consistently tracked; the target agent pays attention to all pedestrians in the scene. The first assumption leads to biased interaction modeling with incomplete pedestrian data, and the second assumption introduces unnecessary disturbances and leads to the freezing robot problem. Thus, we propose Gumbel Social Transformer, in which an Edge Gumbel Selector samples a sparse interaction graph of partially observed pedestrians at each time step. A Node Transformer Encoder and a Masked LSTM encode the pedestrian features with the sampled sparse graphs to predict trajectories. We demonstrate that our model overcomes the potential problems caused by the assumptions, and our approach outperforms the related works in benchmark evaluation.
updated: Mon Jul 19 2021 02:32:28 GMT+0000 (UTC)
published: Thu Jul 15 2021 00:45:11 GMT+0000 (UTC)
