arXiv reaDer
EfficientNetと対照学習を活用して正確なグローバルスケールの位置推定を行う
Leveraging EfficientNet and Contrastive Learning for Accurate Global-scale Location Estimation
本論文では、混合分類検索スキームを提案し、地球規模の画像ジオロケーションの問題に対処します。分類または検索タスクとして問題に厳密に取り組む他の方法とは異なり、2つの異なるモジュールを使用して、各アプローチの利点を活用する統合ソリューションで2つのプラクティスを組み合わせます。 1つ目は、EfficientNetアーキテクチャを活用して、堅牢な方法で特定の地理的セルに画像を割り当てます。 2つ目は、対照的な学習でトレーニングされた新しい残差アーキテクチャを導入して、入力画像を埋め込みスペースにマッピングし、同じ場所の画像のペアワイズ地理的距離を最小化します。最終的な位置推定では、2つのモジュールがセル内検索スキームと組み合わされ、予測された地理セルからの最も類似した画像の位置が空間クラスタリングスキームに基づいて集約されます。私たちのアプローチは、4つの公開データセットで非常に競争力のあるパフォーマンスを示し、Im2GPS3kの1 kmの範囲で15.0%という細かい粒度で新しい最先端のパフォーマンスを実現します。
In this paper, we address the problem of global-scale image geolocation, proposing a mixed classification-retrieval scheme. Unlike other methods that strictly tackle the problem as a classification or retrieval task, we combine the two practices in a unified solution leveraging the advantages of each approach with two different modules. The first leverages the EfficientNet architecture to assign images to a specific geographic cell in a robust way. The second introduces a new residual architecture that is trained with contrastive learning to map input images to an embedding space that minimizes the pairwise geodesic distance of same-location images. For the final location estimation, the two modules are combined with a search-within-cell scheme, where the locations of most similar images from the predicted geographic cell are aggregated based on a spatial clustering scheme. Our approach demonstrates very competitive performance on four public datasets, achieving new state-of-the-art performance in fine granularity scales, i.e., 15.0% at 1km range on Im2GPS3k.
updated: Mon May 17 2021 07:18:43 GMT+0000 (UTC)
published: Mon May 17 2021 07:18:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト