arXiv reaDer
ベイジアン選択的融合による視覚的場所認識のためのインテリジェントリファレンスキュレーション
Intelligent Reference Curation for Visual Place Recognition via Bayesian Selective Fusion
視覚的場所認識(VPR)の重要な課題は、時間帯、季節、天候、照明条件などの要因による視覚的な外観の大幅な変化にもかかわらず、場所を認識することです。ディープラーント画像記述子、シーケンスマッチング、ドメイン翻訳、確率的ローカリゼーションに基づく多数のアプローチがこの課題に対処することに成功していますが、ほとんどの場合、可能な場所の慎重にキュレートされた代表的な参照画像の可用性に依存しています。この論文では、ベイジアンセレクティブフュージョンと呼ばれる新しいアプローチを提案し、有益な参照画像を積極的に選択して融合し、特定のクエリ画像に最適な場所を決定します。私たちのアプローチの選択要素は、すべての参照画像の逆効果的な融合を回避し、視覚条件が変化する環境(屋内の明滅するライト、屋外の天気雨中、昼夜のサイクルなど)で有益な参照画像の動的な選択を可能にします。私たちのアプローチの確率的要素は、VPRの新しいトレーニング不要の尤度関数を介して、さまざまな不確実性を説明する複数の参照画像を融合する手段を提供します。 2つのベンチマークデータセットからの難しいクエリ画像で、私たちのアプローチが、最良の参照画像の事前の(不公平な)知識で提供される最先端の技術とともに、いくつかの代替融合アプローチのパフォーマンスと一致し、それを超えることを示します。私たちのアプローチは、トレーニングがなく、記述子に依存せず、シーケンスマッチングなどの既存の手法を補完するため、動的な視覚環境が一般的である長期的なロボットの自律性に最適です。
A key challenge in visual place recognition (VPR) is recognizing places despite drastic visual appearance changes due to factors such as time of day, season, weather or lighting conditions. Numerous approaches based on deep-learnt image descriptors, sequence matching, domain translation, and probabilistic localization have had success in addressing this challenge, but most rely on the availability of carefully curated representative reference images of the possible places. In this paper, we propose a novel approach, dubbed Bayesian Selective Fusion, for actively selecting and fusing informative reference images to determine the best place match for a given query image. The selective element of our approach avoids the counterproductive fusion of every reference image and enables the dynamic selection of informative reference images in environments with changing visual conditions (such as indoors with flickering lights, outdoors during sunshowers or over the day-night cycle). The probabilistic element of our approach provides a means of fusing multiple reference images that accounts for their varying uncertainty via a novel training-free likelihood function for VPR. On difficult query images from two benchmark datasets, we demonstrate that our approach matches and exceeds the performance of several alternative fusion approaches along with state-of-the-art techniques that are provided with prior (unfair) knowledge of the best reference images. Our approach is well suited for long-term robot autonomy where dynamic visual environments are commonplace since it is training-free, descriptor-agnostic, and complements existing techniques such as sequence matching.
updated: Sun Jan 03 2021 22:28:28 GMT+0000 (UTC)
published: Mon Oct 19 2020 05:17:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト