arXiv reaDer
空間セマンティックConvNetベースの視覚的場所認識
Spatio-Semantic ConvNet-Based Visual Place Recognition
  画像検索パイプラインに共通の2段階形式に従う視覚的場所認識システムを紹介します。システムは、事前にトレーニングされた既製のVGG16畳み込みニューラルネットワーク(CNN)アーキテクチャのさまざまなレイヤーのアクティベーションを使用して、場所の画像をエンコードします。メソッドの最初の段階で、場所のクエリ画像が与えられると、以前に保存された場所のデータベースから多くの上位候補画像が取得されます。第2段階では、セマンティックおよび空間情報をCNN機能の形式でエンコードすることにより、これらの候補に対するクエリイメージの徹底的な比較を提案します。このアプローチの結果は、最も一般的に使用されている5つのベンチマークデータセットで、大きなマージンの最先端の視覚的な場所認識方法により優れています。パフォーマンスの向上は、最も困難なデータセットで特に顕著であり、最新の公開された作品に関して認識が2倍以上改善されています。
We present a Visual Place Recognition system that follows the two-stage format common to image retrieval pipelines. The system encodes images of places by employing the activations of different layers of a pre-trained, off-the-shelf, VGG16 Convolutional Neural Network (CNN) architecture. In the first stage of our method and given a query image of a place, a number of top candidate images is retrieved from a previously stored database of places. In the second stage, we propose an exhaustive comparison of the query image against these candidates by encoding semantic and spatial information in the form of CNN features. Results from our approach outperform by a large margin state-of-the-art visual place recognition methods on five of the most commonly used benchmark datasets. The performance gain is especially remarkable on the most challenging datasets, with more than a twofold recognition improvement with respect to the latest published work.
updated: Tue Sep 17 2019 09:30:24 GMT+0000 (UTC)
published: Tue Sep 17 2019 09:30:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト