画像ベースの場所認識に関する研究努力のほとんどは、都市環境向けに設計されています。テクスチャが少なく、セマンティックコンテンツが少ない自然シーンなどの牧歌的な環境では、主な課題は、照明、天気、植生の状態、視点など、時間の経過に伴う視覚的外観の変化を処理することです。バリエーションの性質は異なり、これは牧歌的なシーンを記述するための異なるアプローチにつながります。セマンティックおよびトポロジカル情報から計算されたグローバルイメージ記述子を導入します。これは、イメージのセマンティックエッジのウェーブレット変換から構築されます。 2つの画像のマッチングは、セマンティックエッジ記述子のマッチングと同等です。この方法が、CMU-SeasonsとSymphony Lakeデータセットの2つのマルチシーズン環境監視データセットで、最先端の画像検索パフォーマンスに達することを示します。また、現在のベースラインNetVLADおよびDELFと同等の都市シーンにも一般化されます。
Most of the research effort on image-based place recognition is designed for urban environments. In bucolic environments such as natural scenes with low texture and little semantic content, the main challenge is to handle the variations in visual appearance across time such as illumination, weather, vegetation state or viewpoints. The nature of the variations is different and this leads to a different approach to describing a bucolic scene. We introduce a global image descriptor computed from its semantic and topological information. It is built from the wavelet transforms of the image semantic edges. Matching two images is then equivalent to matching their semantic edge descriptors. We show that this method reaches state-of-the-art image retrieval performance on two multi-season environment-monitoring datasets: the CMU-Seasons and the Symphony Lake dataset. It also generalises to urban scenes on which it is on par with the current baselines NetVLAD and DELF.