arXiv reaDer
視覚的ジオローカリゼーションのための視点不変の密なマッチング
Viewpoint Invariant Dense Matching for Visual Geolocalization
この論文では、高密度の局所的特徴に基づいて、視覚的なジオローカリゼーションに合わせて調整された画像マッチングの新しい方法を提案します。密な局所的特徴のマッチングは、照明とオクルージョンの変化に対してロバストですが、ジオローカリゼーションの基本的な側面である視点のシフトに対してはロバストではありません。 GeoWarpと呼ばれる私たちの方法は、密な特徴を抽出するプロセスで、視点のシフトに不変性を直接埋め込みます。これは、場所を認識するタスクにとって意味のある不変性をデータから学習するトレーニング可能なモジュールを介して実現されます。また、ラベルなしデータと弱いラベルのみを使用してこのモジュールをトレーニングするために、新しい自己教師あり損失と2つの新しい弱教師あり損失を考案します。 GeoWarpは、既存の視覚的なジオローカリゼーションパイプラインに簡単に組み込むことができる再ランク付け方法として効率的に実装されます。標準のジオローカリゼーションベンチマークでの実験的検証は、GeoWarpが最先端の検索アーキテクチャの精度を高めることを示しています。コードとトレーニング済みモデルはhttps://github.com/gmberton/geo_warpで入手できます。
In this paper we propose a novel method for image matching based on dense local features and tailored for visual geolocalization. Dense local features matching is robust against changes in illumination and occlusions, but not against viewpoint shifts which are a fundamental aspect of geolocalization. Our method, called GeoWarp, directly embeds invariance to viewpoint shifts in the process of extracting dense features. This is achieved via a trainable module which learns from the data an invariance that is meaningful for the task of recognizing places. We also devise a new self-supervised loss and two new weakly supervised losses to train this module using only unlabeled data and weak labels. GeoWarp is implemented efficiently as a re-ranking method that can be easily embedded into pre-existing visual geolocalization pipelines. Experimental validation on standard geolocalization benchmarks demonstrates that GeoWarp boosts the accuracy of state-of-the-art retrieval architectures. The code and trained models are available at https://github.com/gmberton/geo_warp
updated: Mon Sep 20 2021 20:17:38 GMT+0000 (UTC)
published: Mon Sep 20 2021 20:17:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト