arXiv reaDer
StretchBEV:将来のインスタンス予測を空間的および時間的にストレッチする
StretchBEV: Stretching Future Instance Prediction Spatially and Temporally
自動運転では、車両周辺のすべてのエージェントの位置と動きの観点から将来を予測することが、計画の重要な要件です。最近、複数のカメラから知覚された豊富な感覚情報をコンパクトな鳥瞰図表現に融合して予測を実行することにより、知覚と予測の新しい共同定式化が登場しました。ただし、将来の予測の品質は時間の経過とともに低下しますが、複数のもっともらしい予測により、より長い期間に拡張されます。この作業では、確率的時間モデルを使用して、将来の予測におけるこの固有の不確実性に対処します。私たちのモデルは、各タイムステップでの確率的残差更新を通じて潜在空間の時間的ダイナミクスを学習します。各タイムステップで学習された分布からサンプリングすることにより、以前の作業と比較してより正確な、より多様な将来の予測を取得します。特に、シーン内の空間的に遠い領域と、より長い時間範囲にわたる時間の両方を拡張します。各タイムステップの個別の処理にもかかわらず、ダイナミクスの学習と将来の予測の生成を分離することにより、モデルは依然として効率的です。
In self-driving, predicting future in terms of location and motion of all the agents around the vehicle is a crucial requirement for planning. Recently, a new joint formulation of perception and prediction has emerged by fusing rich sensory information perceived from multiple cameras into a compact bird's-eye view representation to perform prediction. However, the quality of future predictions degrades over time while extending to longer time horizons due to multiple plausible predictions. In this work, we address this inherent uncertainty in future predictions with a stochastic temporal model. Our model learns temporal dynamics in a latent space through stochastic residual updates at each time step. By sampling from a learned distribution at each time step, we obtain more diverse future predictions that are also more accurate compared to previous work, especially stretching both spatially further regions in the scene and temporally over longer time horizons. Despite separate processing of each time step, our model is still efficient through decoupling of the learning of dynamics and the generation of future predictions.
updated: Fri Mar 25 2022 13:28:44 GMT+0000 (UTC)
published: Fri Mar 25 2022 13:28:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト