arXiv reaDer
PRISM: 空間世界モデルにおける確率的リアルタイム推論
PRISM: Probabilistic Real-Time Inference in Spatial World Models
エージェントの動きと視覚の確率的生成モデルにおけるリアルタイム フィルタリングの手法である PRISM を紹介します。以前のアプローチでは、マップとエージェントの状態の不確実性の推定が欠けているか、リアルタイムで実行されないか、高密度のシーン表現がないか、エージェントのダイナミクスをモデル化していません。当社のソリューションは、これらすべての側面を調整します。微分可能なレンダリングと 6-DoF ダイナミクスを組み合わせた定義済みの状態空間モデルから始めます。このモデルでの確率論的推論は、ローカリゼーションとマッピングの同時実行 (SLAM) に相当し、扱いにくいものです。ベイジアン推論に一連の近似を使用して、確率マップと状態推定に到達します。確立された方法とクローズド フォームの更新を利用して、精度を維持し、リアルタイム機能を実現します。提案されたソリューションは 10Hz リアルタイムで実行され、高速 UAV とハンドヘルド カメラ エージェント (Blackbird、EuRoC、および TUM-RGBD) を使用する小規模から中規模の屋内環境で最先端の SLAM と同様に正確です。
We introduce PRISM, a method for real-time filtering in a probabilistic generative model of agent motion and visual perception. Previous approaches either lack uncertainty estimates for the map and agent state, do not run in real-time, do not have a dense scene representation or do not model agent dynamics. Our solution reconciles all of these aspects. We start from a predefined state-space model which combines differentiable rendering and 6-DoF dynamics. Probabilistic inference in this model amounts to simultaneous localisation and mapping (SLAM) and is intractable. We use a series of approximations to Bayesian inference to arrive at probabilistic map and state estimates. We take advantage of well-established methods and closed-form updates, preserving accuracy and enabling real-time capability. The proposed solution runs at 10Hz real-time and is similarly accurate to state-of-the-art SLAM in small to medium-sized indoor environments, with high-speed UAV and handheld camera agents (Blackbird, EuRoC and TUM-RGBD).
updated: Tue Dec 06 2022 13:59:06 GMT+0000 (UTC)
published: Tue Dec 06 2022 13:59:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト