arXiv reaDer
なぜそう深いのか:視覚的な場所認識のために以前に訓練されたモデルの強化に向けて
Why-So-Deep: Towards Boosting Previously Trained Models for Visual Place Recognition
ループ閉鎖検出のための深層学習ベースの画像検索技術は、満足のいくパフォーマンスを示しています。ただし、さまざまな地理的地域で以前にトレーニングされたモデルに基づいて高レベルのパフォーマンスを達成することは依然として困難です。このホワイトペーパーでは、新しい環境での同時ローカリゼーションおよびマッピング(SLAM)システムを使用した展開の問題について説明します。一般的なベースラインアプローチでは、GPS、シーケンシャルキーフレームトラッキング、環境全体の再トレーニングなどの追加情報を使用して、リコール率を高めます。以前に訓練されたモデルに基づいて画像検索を改善するための新しいアプローチを提案します。より良い画像想起とリアルタイムマルチエージェントSLAMシステムへのその応用のために事前に訓練されたモデルの力を増幅するためのインテリジェントな方法MAQBOOLを提示します。最先端の方法の高い記述子次元(4096-D)と比較して、低い記述子次元(512-D)で同等の画像検索結果を達成します。空間情報を使用して、事前にトレーニングされたモデルでの画像検索の再現率を向上させます。
Deep learning-based image retrieval techniques for the loop closure detection demonstrate satisfactory performance. However, it is still challenging to achieve high-level performance based on previously trained models in different geographical regions. This paper addresses the problem of their deployment with simultaneous localization and mapping (SLAM) systems in the new environment. The general baseline approach uses additional information, such as GPS, sequential keyframes tracking, and re-training the whole environment to enhance the recall rate. We propose a novel approach for improving image retrieval based on previously trained models. We present an intelligent method, MAQBOOL, to amplify the power of pre-trained models for better image recall and its application to real-time multiagent SLAM systems. We achieve comparable image retrieval results at a low descriptor dimension (512-D), compared to the high descriptor dimension (4096-D) of state-of-the-art methods. We use spatial information to improve the recall rate in image retrieval on pre-trained models.
updated: Mon Jan 10 2022 08:39:06 GMT+0000 (UTC)
published: Mon Jan 10 2022 08:39:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト