arXiv reaDer
段階的類似性監視によるデータ効率の高い大規模な場所認識
Data-efficient Large Scale Place Recognition with Graded Similarity Supervision
視覚的場所認識 (VPR) は、視覚的位置特定のためのコンピューター ビジョンの基本的なタスクです。既存の方法は、同じ場所を描写するか、または描写しない画像ペアを使用してトレーニングされます。このようなバイナリ表示は、カメラのポーズの連続性によって決定される、異なる位置から撮影された同じ場所の画像間の類似性の連続関係を考慮していません。バイナリの類似性により、VPR メソッドのトレーニングにノイズの多い監視信号が誘導されます。これは、極小値で停止し、収束を保証するために高価なハード マイニング アルゴリズムを必要とします。カメラのポーズの違いにより、同じ場所の 2 つの画像が視覚的な手がかりを部分的にしか共有しないという事実に動機付けられて、VPR データセットを再ラベル付けするための自動再注釈戦略を展開します。利用可能なローカリゼーション メタデータに基づいて、画像ペアの段階的類似性ラベルを計算します。さらに、対照ネットワークのトレーニングに段階的類似性ラベルを使用する新しい一般化対照損失 (GCL) を提案します。新しいラベルと GCL を使用することで、ハード ペア マイニングを省き、最近傍探索によって VPR でより優れたパフォーマンスを発揮する画像記述子をトレーニングできることを実証し、高価なハード ペア マイニングと再ランキングのテクニック。入手可能なコードとモデル: https://github.com/marialeyvallina/generalized_contrasive_loss
Visual place recognition (VPR) is a fundamental task of computer vision for visual localization. Existing methods are trained using image pairs that either depict the same place or not. Such a binary indication does not consider continuous relations of similarity between images of the same place taken from different positions, determined by the continuous nature of camera pose. The binary similarity induces a noisy supervision signal into the training of VPR methods, which stall in local minima and require expensive hard mining algorithms to guarantee convergence. Motivated by the fact that two images of the same place only partially share visual cues due to camera pose differences, we deploy an automatic re-annotation strategy to re-label VPR datasets. We compute graded similarity labels for image pairs based on available localization metadata. Furthermore, we propose a new Generalized Contrastive Loss (GCL) that uses graded similarity labels for training contrastive networks. We demonstrate that the use of the new labels and GCL allow to dispense from hard-pair mining, and to train image descriptors that perform better in VPR by nearest neighbor search, obtaining superior or comparable results than methods that require expensive hard-pair mining and re-ranking techniques. Code and models available at: https://github.com/marialeyvallina/generalized_contrastive_loss
updated: Tue Mar 21 2023 10:56:57 GMT+0000 (UTC)
published: Tue Mar 21 2023 10:56:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト