arXiv reaDer
アーリーバード:知覚的にエイリアシングされた屋内環境の反対の視点からのループクロージャ
Early Bird: Loop Closures from Opposing Viewpoints for Perceptually-Aliased Indoor Environments
最近、深層学習ベースの方法の急増により、視覚的場所認識(VPR)、機能の対応、およびローカリゼーションが大幅に進歩しました。ただし、既存のアプローチでは、視点の変更と知覚的エイリアシングという2つの主要な課題のうちの1つだけに部分的または完全に対処する傾向があります。この論文では、グランドプレーンでのナビゲーションに関する合理的なドメインの仮定に基づいて、深く学習された機能と幾何学的変換を組み合わせることで両方の課題に同時に対処すると同時に、特殊なハードウェア設定(照明、下向きなど)の要件を排除する新しい研究を紹介します。カメラ)。特に、深く学習された機能の堅牢性とホモグラフィベースの極端な視点の不変性を活用することによるVPRとSLAMの統合により、SLAMパイプラインのVPR、機能対応、ポーズグラフサブモジュールのパフォーマンスが大幅に向上します。初めて、実世界およびシミュレートされた実験の範囲で、知覚エイリアシングおよび極端な180度回転した視点の変化にもかかわらず、最先端のパフォーマンスが可能なローカリゼーションシステムを示します。私たちのシステムは、SLAM軌道の大幅なドリフトを防ぐ早期ループクロージャを実現できます。また、VPRと記述子のマッチングについて、いくつかの深いアーキテクチャを広範囲に比較します。また、反対側のビュー間での優れた場所認識と記述子マッチングにより、バックエンドポーズグラフの最適化で同様のパフォーマンスが向上することも示しています。
Significant advances have been made recently in Visual Place Recognition (VPR), feature correspondence, and localization due to the proliferation of deep-learning-based methods. However, existing approaches tend to address, partially or fully, only one of two key challenges: viewpoint change and perceptual aliasing. In this paper, we present novel research that simultaneously addresses both challenges by combining deep-learned features with geometric transformations based on reasonable domain assumptions about navigation on a ground-plane, whilst also removing the requirement for specialized hardware setup (e.g. lighting, downwards facing cameras). In particular, our integration of VPR with SLAM by leveraging the robustness of deep-learned features and our homography-based extreme viewpoint invariance significantly boosts the performance of VPR, feature correspondence, and pose graph submodules of the SLAM pipeline. For the first time, we demonstrate a localization system capable of state-of-the-art performance despite perceptual aliasing and extreme 180-degree-rotated viewpoint change in a range of real-world and simulated experiments. Our system is able to achieve early loop closures that prevent significant drifts in SLAM trajectories. We also compare extensively several deep architectures for VPR and descriptor matching. We also show that superior place recognition and descriptor matching across opposite views results in a similar performance gain in back-end pose graph optimization.
updated: Tue Dec 15 2020 21:29:46 GMT+0000 (UTC)
published: Sat Oct 03 2020 20:18:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト