arXiv reaDer
カメラポーズ回帰のためのCNNメソッドの制限の再評価
Reassessing the Limitations of CNN Methods for Camera Pose Regression
この論文では、屋外と屋内のシナリオでのカメラポーズ推定の問題に対処します。 2Dから3Dへのマッチングに依存する現在最高のパフォーマンスの方法と比較して、同じクラスの既存の方法よりも大幅に高い精度で画像からカメラのポーズを直接回帰できるモデルを提案します。まず、回帰手法が依然として最先端の技術に遅れをとっている理由を分析し、新しいアプローチでパフォーマンスのギャップを埋めます。具体的には、新しいトレーニングビューを合成するためのトレーニングセットから確率分布によって導かれるポーズを生成する新しいトレーニング手法によって、偏ったトレーニングデータを克服する方法を提案します。最後に、広く使用されている2つのベンチマークでアプローチを評価し、以前の回帰ベースの方法、検索手法、およびローカル機能マッチングを使用した3Dパイプラインと比較して大幅に改善されたパフォーマンスを達成することを示します。
In this paper, we address the problem of camera pose estimation in outdoor and indoor scenarios. In comparison to the currently top-performing methods that rely on 2D to 3D matching, we propose a model that can directly regress the camera pose from images with significantly higher accuracy than existing methods of the same class. We first analyse why regression methods are still behind the state-of-the-art, and we bridge the performance gap with our new approach. Specifically, we propose a way to overcome the biased training data by a novel training technique, which generates poses guided by a probability distribution from the training set for synthesising new training views. Lastly, we evaluate our approach on two widely used benchmarks and show that it achieves significantly improved performance compared to prior regression-based methods, retrieval techniques as well as 3D pipelines with local feature matching.
updated: Mon Aug 16 2021 17:55:26 GMT+0000 (UTC)
published: Mon Aug 16 2021 17:55:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト