HOME: Heatmap Output for future Motion Estimation
本論文では、エージェントの将来の位置の確率分布を表す画像出力を用いて、動き予測問題に取り組むフレームワークであるHOMEを提案する。この方法は、エージェントの相互作用のための注意メカニズムと組み合わされた古典的な畳み込みネットワークを備えた単純なアーキテクチャを可能にし、エージェントの可能な将来の制約のない2Dトップビュー表現を出力します。この出力に基づいて、エージェントの将来の場所の有限セットをサンプリングする2つの方法を設計します。これらの方法により、モデルのどの部分も再トレーニングすることなく、複数のモダリティのミス率と最終変位エラーの間の最適化のトレードオフを制御できます。 Argoverse Motion Forecastingベンチマークにこの方法を適用し、オンラインリーダーボードで1位を獲得しました。
In this paper, we propose HOME, a framework tackling the motion forecasting problem with an image output representing the probability distribution of the agent's future location. This method allows for a simple architecture with classic convolution networks coupled with attention mechanism for agent interactions, and outputs an unconstrained 2D top-view representation of the agent's possible future. Based on this output, we design two methods to sample a finite set of agent's future locations. These methods allow us to control the optimization trade-off between miss rate and final displacement error for multiple modalities without having to retrain any part of the model. We apply our method to the Argoverse Motion Forecasting Benchmark and achieve 1st place on the online leaderboard.
updated: Wed Jun 02 2021 11:26:47 GMT+0000 (UTC)
published: Sun May 23 2021 16:27:04 GMT+0000 (UTC)
