社会に準拠したロボットや自動運転車を開発するには、将来の位置を予測したり、街路、ショッピングモール、広場などの都市シナリオでの複雑な相互作用を解釈したりする人間の能力を模倣することが不可欠です。自律システムは、衝突を回避したり、人間と自然にふるまうために、人間の動きを予測する上で有利になる場合があります。もっともらしい軌道を予測するために、3つの基本的な要因を考慮したLSTM(長期短期記憶)ベースのモデルを構築します:人の相互作用、以前に交差した領域に関する過去の観測、および周囲の空間の意味。このモデルには、複数のテンソル、つまりソーシャル、ナビゲーション、セマンティックテンソルを定義する上記の要素を結合するいくつかのプーリングメカニズムが含まれます。ネットワークは、内部(意図)および外部(他の人々、アクセスできない領域)の両方の動機に従って複雑なパスが出現する非構造化環境でテストされます。実証されているように、社会的相互作用やコンテキスト情報を認識しない経路のモデリングは、将来の位置を正しく予測するには不十分です。実験結果は、人間の経路予測のためのLSTMベースのモデルと比較して、提案されたフレームワークの有効性を裏付けています。
Mimicking human ability to forecast future positions or interpret complex interactions in urban scenarios, such as streets, shopping malls or squares, is essential to develop socially compliant robots or self-driving cars. Autonomous systems may gain advantage on anticipating human motion to avoid collisions or to naturally behave alongside people. To foresee plausible trajectories, we construct an LSTM (long short-term memory)-based model considering three fundamental factors: people interactions, past observations in terms of previously crossed areas and semantics of surrounding space. Our model encompasses several pooling mechanisms to join the above elements defining multiple tensors, namely social, navigation and semantic tensors. The network is tested in unstructured environments where complex paths emerge according to both internal (intentions) and external (other people, not accessible areas) motivations. As demonstrated, modeling paths unaware of social interactions or context information, is insufficient to correctly predict future positions. Experimental results corroborate the effectiveness of the proposed framework in comparison to LSTM-based models for human path prediction.