視覚的観察からエージェントの将来の軌跡を予測することは、動的環境での自律システムの安全で効果的なナビゲーションを実現するための重要な問題です。この論文は、モバイルプラットフォームに特に関連する将来の軌道予測の2つの重要な側面に焦点を当てています。1)特にエゴセントリックビューからの予測の不確実性のモデリング。 -モーション、および2)問題のマルチモダリティの性質のモデリング。これは、都市交通シーンのジャンクションで特に一般的です。統一されたアプローチでこれらの問題に対処するために、エゴセントリックビューでのエージェントの将来予測のために、NEMO(将来のオブジェクトのローカリゼーションのためのノイジーエゴMOtion事前分布)を提案します。提案されたアプローチでは、将来の予測の予測分布が予測の不確実性と一緒にモデル化されます。このため、問題を2つのタスクに分割します:将来の自我運動予測と将来のオブジェクトのローカリゼーション。まず、不確実性の推定値を使用して、将来のエゴモーションのマルチモーダル分布をモデル化します。結果として得られる自我行動の分布を使用して、将来の自我運動の複数のモードをサンプリングします。次に、各モダリティは、エゴビークルとターゲットエージェント間の相互作用を理解する前に使用されます。ターゲットの挙動の不確実性をモデル化しながら、エゴビークルの個々のモードからターゲットのマルチモーダルな将来の位置を予測します。この目的のために、公的に利用可能なベンチマークデータセット(HEV-I)を使用して提案されたフレームワークを広範囲に評価し、慣性測定ユニット(IMU)からの走行距離データを追加しました。
Predicting the future trajectory of agents from visual observations is an important problem for realization of safe and effective navigation of autonomous systems in dynamic environments. This paper focuses on two important aspects of future trajectory forecast which are particularly relevant for mobile platforms: 1) modeling uncertainty of the predictions, particularly from egocentric views, where uncertainty in the interactive reactions and behaviors of other agents must consider the uncertainty in the ego-motion, and 2) modeling multi-modality nature of the problem, which are particularly prevalent at junctions in urban traffic scenes. To address these problems in a unified approach, we propose NEMO (Noisy Ego MOtion priors for future object localization) for future forecast of agents in the egocentric view. In the proposed approach, a predictive distribution of future forecast is jointly modeled with the uncertainty of predictions. For this, we divide the problem into two tasks: future ego-motion prediction and future object localization. We first model the multi-modal distribution of future ego-motion with uncertainty estimates. The resulting distribution of ego-behavior is used to sample multiple modes of future ego-motion. Then, each modality is used as a prior to understand the interactions between the ego-vehicle and target agent. We predict the multi-modal future locations of the target from individual modes of the ego-vehicle while modeling the uncertainty of the target's behavior. To this end, we extensively evaluate the proposed framework using the publicly available benchmark dataset (HEV-I) supplemented with odometry data from an Inertial Measurement Unit (IMU).