arXiv reaDer
APS:大規模なマルチモーダル屋内カメラポジショニングシステム
APS: A Large-Scale Multi-Modal Indoor Camera Positioning System
GPS信号にアクセスできない閉鎖領域内のナビゲーションは、非常に困難な作業です。この問題に取り組むために、最近、画像ベースの方法が多くの研究者の注目を集めています。これらの方法は、特徴を抽出し(たとえば、SIFTまたはSOSNetを使用して)、記述的な特徴をカメラの位置と回転の情報にマッピングするか、PoseNetと同様に、RGB画像からこの情報を直接推定するエンドツーエンドのシステムを展開します。前者の方法は、テストプロセス中の計算負荷が大きいのに対し、後者は、環境の変化やオブジェクトの動きに対する精度と堅牢性の欠如に悩まされています。ただし、エンドツーエンドシステムは、テストと推論の間は非常に高速であり、トレーニングフェーズが以前のシステムよりも長くなる可能性がある場合でも、実際のアプリケーションに適しています。本論文では、大規模な屋内測位のための新しいマルチモーダルエンドツーエンドシステム、すなわち、Pix2Pix GANネットワークを統合して入力クエリ画像の点群ペアを再構築するAPS(アルファ測位システム)を提案しました。 、カメラの位置と回転情報を確実に推定するための深いCNNネットワークを備えています。この統合では、既存のデータセットには、屋内環境用のペアのRGB /ポイントクラウドイメージの欠点があります。したがって、この状況を処理するために新しいデータセットを作成しました。提案されたAPSシステムを実装することにより、1センチメートル未満の精度レベルで高精度のカメラ測位を実現できました。
Navigation inside a closed area with no GPS-signal accessibility is a highly challenging task. In order to tackle this problem, recently the imaging-based methods have grabbed the attention of many researchers. These methods either extract the features (e.g. using SIFT, or SOSNet) and map the descriptive ones to the camera position and rotation information, or deploy an end-to-end system that directly estimates this information out of RGB images, similar to PoseNet. While the former methods suffer from heavy computational burden during the test process, the latter suffers from lack of accuracy and robustness against environmental changes and object movements. However, end-to-end systems are quite fast during the test and inference and are pretty qualified for real-world applications, even though their training phase could be longer than the former ones. In this paper, a novel multi-modal end-to-end system for large-scale indoor positioning has been proposed, namely APS (Alpha Positioning System), which integrates a Pix2Pix GAN network to reconstruct the point cloud pair of the input query image, with a deep CNN network in order to robustly estimate the position and rotation information of the camera. For this integration, the existing datasets have the shortcoming of paired RGB/point cloud images for indoor environments. Therefore, we created a new dataset to handle this situation. By implementing the proposed APS system, we could achieve a highly accurate camera positioning with a precision level of less than a centimeter.
updated: Mon Feb 08 2021 11:37:09 GMT+0000 (UTC)
published: Mon Feb 08 2021 11:37:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト