正確な視覚的再ローカリゼーションは、拡張現実、仮想現実、ロボット工学、自動運転など、多くの人工知能アプリケーションにとって非常に重要です。このタスクを実行するために、画像検索、セマンティック整合性、およびジオメトリ検証を組み合わせて正確な推定を実現することにより、RLOCSと呼ばれる統合された視覚的再ローカリゼーション手法を提案します。ローカリゼーションパイプラインは、粗いパラダイムから細かいパラダイムとして設計されています。検索部分では、ResNet101-GeM-ArcFaceのアーキテクチャをカスケードし、DBSCANとそれに続く空間検証を使用して、より良い初期の粗いポーズを取得します。観測制約と呼ばれるモジュールを設計します。これは、外れ値をフィルタリングするためのジオメトリ情報とセマンティックの一貫性を組み合わせたものです。 R-Oxford5kとR-Paris6kでの検索、Cityscapesでのセマンティックセグメンテーション、Aachen Day-NightとInLocでのローカリゼーションなど、包括的な実験がオープンデータセットで実施されます。パイプライン全体で個別のモジュールを創造的に変更することにより、私たちの方法は、困難なローカリゼーションベンチマークで多くのパフォーマンスの向上を実現します。
Accurate visual re-localization is very critical to many artificial intelligence applications, such as augmented reality, virtual reality, robotics and autonomous driving. To accomplish this task, we propose an integrated visual re-localization method called RLOCS by combining image retrieval, semantic consistency and geometry verification to achieve accurate estimations. The localization pipeline is designed as a coarse-to-fine paradigm. In the retrieval part, we cascade the architecture of ResNet101-GeM-ArcFace and employ DBSCAN followed by spatial verification to obtain a better initial coarse pose. We design a module called observation constraints, which combines geometry information and semantic consistency for filtering outliers. Comprehensive experiments are conducted on open datasets, including retrieval on R-Oxford5k and R-Paris6k, semantic segmentation on Cityscapes, localization on Aachen Day-Night and InLoc. By creatively modifying separate modules in the total pipeline, our method achieves many performance improvements on the challenging localization benchmarks.