Retrieval-based Localization Based on Domain-invariant Feature Learning under Changing Environments
  視覚的ローカリゼーションは、モバイルロボット工学および自動運転の重要な問題です。 1つの解決策は、クエリ画像のローカライズのためにデータベースから既知のポーズの画像を取得することです。ただし、状況が大幅に変化する環境(照明の変化、季節、オクルージョン、動的オブジェクトなど)では、検索ベースのローカリゼーションが大幅に妨げられ、困難な問題になります。本論文では、マルチドメイン画像変換ネットワークアーキテクチャであるComboGANに基づいて、新しいドメイン不変特徴学習法(DIFL)を提案します。元の画像のエンコードされた特徴と別のドメインの翻訳された画像の間に特徴の一貫性の損失(FCL)を導入することにより、自己監視方式でドメイン不変の特徴を生成するエンコーダーをトレーニングすることができます。データベースからターゲットイメージを取得するには、まずクエリドメインに属するエンコーダーを使用してクエリイメージをエンコードし、ドメイン不変の特徴ベクトルを取得します。次に、最も類似したドメイン不変の特徴ベクトルを持つデータベース画像を選択して、検索を実行します。 CMU-Seasonsデータセットで提案されたアプローチを検証します。このアプローチでは、高精度および中精度のシナリオの検索ベースのローカリゼーションで最先端の学習ベースの記述子よりも優れています。
Visual localization is a crucial problem in mobile robotics and autonomous driving. One solution is to retrieve images with known pose from a database for the localization of query images. However, in environments with drastically varying conditions (e.g. illumination changes, seasons, occlusion, dynamic objects), retrieval-based localization is severely hampered and becomes a challenging problem. In this paper, a novel domain-invariant feature learning method (DIFL) is proposed based on ComboGAN, a multi-domain image translation network architecture. By introducing a feature consistency loss (FCL) between the encoded features of the original image and translated image in another domain, we are able to train the encoders to generate domain-invariant features in a self-supervised manner. To retrieve a target image from the database, the query image is first encoded using the encoder belonging to the query domain to obtain a domain-invariant feature vector. We then preform retrieval by selecting the database image with the most similar domain-invariant feature vector. We validate the proposed approach on the CMU-Seasons dataset, where we outperform state-of-the-art learning-based descriptors in retrieval-based localization for high and medium precision scenarios.
updated: Mon Sep 23 2019 06:47:37 GMT+0000 (UTC)
published: Mon Sep 23 2019 06:47:37 GMT+0000 (UTC)
