arXiv reaDer
AtLoc:注意ガイド付きカメラのローカリゼーション
AtLoc: Attention Guided Camera Localization
  ディープラーニングは、カメラのローカリゼーションで印象的な結果を達成しましたが、現在の単一画像技術は通常、堅牢性の欠如に悩まされ、大きな外れ値につながります。ある程度まで、これはシーケンシャル(マルチイメージ)またはジオメトリ制約アプローチによって取り組まれており、動的オブジェクトと照明条件を拒否してパフォーマンスを向上させることができます。この作業では、単一の画像のみを入力として使用する場合でも、注意を使用して、ネットワークをより幾何学的に堅牢なオブジェクトと機能に集中させ、共通のベンチマークで最先端のパフォーマンスを実現できることを示します。屋内および屋外の公共データセットを通じて、広範な実験的証拠が提供されます。顕著性マップの視覚化を通じて、ネットワークが動的オブジェクトを拒否することを学習し、優れたグローバルカメラポーズ回帰パフォーマンスを実現する方法を示します。ソースコードはhttps://github.com/BingCS/AtLocで入手できます。
Deep learning has achieved impressive results in camera localization, but current single-image techniques typically suffer from a lack of robustness, leading to large outliers. To some extent, this has been tackled by sequential (multi-images) or geometry constraint approaches, which can learn to reject dynamic objects and illumination conditions to achieve better performance. In this work, we show that attention can be used to force the network to focus on more geometrically robust objects and features, achieving state-of-the-art performance in common benchmark, even if using only a single image as input. Extensive experimental evidence is provided through public indoor and outdoor datasets. Through visualization of the saliency maps, we demonstrate how the network learns to reject dynamic objects, yielding superior global camera pose regression performance. The source code is avaliable at https://github.com/BingCS/AtLoc.
updated: Mon Oct 28 2019 16:56:07 GMT+0000 (UTC)
published: Sun Sep 08 2019 22:33:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト