arXiv reaDer
NeuMap: カメラ位置特定のための自動トランスデコーダーによるニューラル座標マッピング
NeuMap: Neural Coordinate Mapping by Auto-Transdecoder for Camera Localization
このホワイト ペーパーでは、NeuMap と呼ばれるカメラ ローカリゼーションのためのエンド ツー エンドのニューラル マッピング手法を紹介します。これは、シーン全体を潜在コードのグリッドにエンコードし、Transformer ベースの自動デコーダーがクエリ ピクセルの 3D 座標を回帰します。最先端のフィーチャ マッチング方法では、各シーンをポイントごとのフィーチャを持つ 3D ポイント クラウドとして保存する必要があり、シーンごとに数ギガバイトのストレージを消費します。圧縮は可能ですが、圧縮率が高いとパフォーマンスが大幅に低下します。逆に、座標回帰法はシーン情報をニューラル ネットワークに格納することで高圧縮を実現しますが、ロバスト性が低下します。 NeuMap は、1) 効率的なシーン表現のための学習可能な潜在コードと、2) クエリ ピクセルの座標を推測するためのシーンにとらわれない Transformer ベースの自動デコーダを利用することで、両方のアプローチの利点を組み合わせます。このシーンに依存しないネットワーク設計は、大規模なデータからロバストなマッチングの事前確率を学習し、ネットワークの重みを固定したまま、新しいシーンのコードの迅速な最適化を可能にします。 5 つのベンチマークでの広範な評価により、NeuMap は他の座標回帰手法よりも大幅に優れており、フィーチャ マッチング手法に匹敵するパフォーマンスを実現しながら、必要なシーン表現サイズははるかに小さいことが示されています。たとえば、NeuMap はわずか 6MB のデータでアーヘンの夜のベンチマークで 39.1% の精度を達成しますが、別の方法は 100MB または数ギガバイトを必要とし、高圧縮設定では完全に失敗します。コードは https://github.com/Tangshitao/NeuMap で入手できます。
This paper presents an end-to-end neural mapping method for camera localization, dubbed NeuMap, encoding a whole scene into a grid of latent codes, with which a Transformer-based auto-decoder regresses 3D coordinates of query pixels. State-of-the-art feature matching methods require each scene to be stored as a 3D point cloud with per-point features, consuming several gigabytes of storage per scene. While compression is possible, performance drops significantly at high compression rates. Conversely, coordinate regression methods achieve high compression by storing scene information in a neural network but suffer from reduced robustness. NeuMap combines the advantages of both approaches by utilizing 1) learnable latent codes for efficient scene representation and 2) a scene-agnostic Transformer-based auto-decoder to infer coordinates for query pixels. This scene-agnostic network design learns robust matching priors from large-scale data and enables rapid optimization of codes for new scenes while keeping the network weights fixed. Extensive evaluations on five benchmarks show that NeuMap significantly outperforms other coordinate regression methods and achieves comparable performance to feature matching methods while requiring a much smaller scene representation size. For example, NeuMap achieves 39.1% accuracy in the Aachen night benchmark with only 6MB of data, whereas alternative methods require 100MB or several gigabytes and fail completely under high compression settings. The codes are available at https://github.com/Tangshitao/NeuMap
updated: Sun Mar 26 2023 06:22:15 GMT+0000 (UTC)
published: Mon Nov 21 2022 04:46:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト