手作りの特徴対応の代わりに、外部から推定されたオプティカルフローフィールドを入力として使用する高密度間接視覚オドメトリ法を提案します。問題を確率モデルとして定義し、カメラの動き、ピクセル深度、およびモーショントラックの信頼性を共同で推論するための一般化されたEM定式化を開発します。ガウス分布の観測誤差を想定した従来の方法とは異なり、(経験的に検証された)適応型対数ロジスティック分布モデルの下で推論フレームワークを監視します。さらに、対数ロジスティック残余モデルは、さまざまな最先端のオプティカルフロー手法によく一般化されているため、私たちのアプローチはモジュール式であり、オプティカルフロー推定量の選択にとらわれません。私たちの方法は、TUMRGB-DとKITTIオドメトリベンチマークの両方でトップランクの結果を達成しました。私たちのオープンソース実装は本質的にGPUに対応しており、計算とストレージが直線的に増加するだけです。
We propose a dense indirect visual odometry method taking as input externally estimated optical flow fields instead of hand-crafted feature correspondences. We define our problem as a probabilistic model and develop a generalized-EM formulation for the joint inference of camera motion, pixel depth, and motion-track confidence. Contrary to traditional methods assuming Gaussian-distributed observation errors, we supervise our inference framework under an (empirically validated) adaptive log-logistic distribution model. Moreover, the log-logistic residual model generalizes well to different state-of-the-art optical flow methods, making our approach modular and agnostic to the choice of optical flow estimators. Our method achieved top-ranking results on both TUM RGB-D and KITTI odometry benchmarks. Our open-sourced implementation is inherently GPU-friendly with only linear computational and storage growth.