本論文では、センサーデータからの関係行動予測の問題に取り組みます。この目標に向けて、シーン内のエージェント間の相互作用をモデル化する新しい空間認識グラフニューラルネットワーク(SpAGNN)を提案します。具体的には、畳み込みニューラルネットワークを活用して、アクターを検出し、その初期状態を計算します。グラフニューラルネットワークは、メッセージパッシングプロセスを介してアクターの状態を繰り返し更新します。ガウスの信念伝播に触発されて、メッセージを、近隣のエージェントからの出力分布の空間的に変換されたパラメーターになるように設計します。このモデルは完全に微分可能であるため、エンドツーエンドのトレーニングが可能です。重要なのは、確率的予測が軌道レベルで不確実性をモデル化できることです。 ATG4DとnuScenesの2つの実世界の自動運転データセットで、最先端技術を大幅に改善することで、アプローチの有効性を実証します。
In this paper, we tackle the problem of relational behavior forecasting from sensor data. Towards this goal, we propose a novel spatially-aware graph neural network (SpAGNN) that models the interactions between agents in the scene. Specifically, we exploit a convolutional neural network to detect the actors and compute their initial states. A graph neural network then iteratively updates the actor states via a message passing process. Inspired by Gaussian belief propagation, we design the messages to be spatially-transformed parameters of the output distributions from neighboring agents. Our model is fully differentiable, thus enabling end-to-end training. Importantly, our probabilistic predictions can model uncertainty at the trajectory level. We demonstrate the effectiveness of our approach by achieving significant improvements over the state-of-the-art on two real-world self-driving datasets: ATG4D and nuScenes.