過去数年で、ディープたたみ込みニューラルネットワーク(D-CNN)は、長期的なインテリジェントロボットビジョン(ビジョン認識)の重要なコンポーネントである視覚的場所認識(VPR)の最先端(SOTA)パフォーマンスを示しましたローカリゼーションおよびナビゲーションシステム)。大規模な場所のデータセットのトレーニングで得られたD-CNNの権威ある一般化能力と、変化する条件とカメラの視点の下で特定の場所の認識に対してロバストであることがわかっている永続的な画像領域を学習しました。ただし、リソースに制約のある移動ロボットのおおよその位置を決定するために使用される計算および電力集約型のD-CNNベースのVPRアルゴリズムに対して、軽量のVPR技術が推奨されます。このホワイトペーパーでは、環境不変VPRに効率的な場所固有の多層畳み込み注意を捉える、計算効率が高くエネルギー効率の高いCAMALフレームワークについて説明します。 4分の1の低消費電力で、挑戦的なベンチマークの場所認識データセットで提案されたVPRフレームワークを評価すると、現在のVPR手法に比べて画像検索パフォーマンスが約4倍向上した、精度再現率(AUC-PR)曲線の下のより良い比較可能な領域が明らかになります。
In the last few years, Deep Convolutional Neural Networks (D-CNNs) have shown state-of-the-art (SOTA) performance for Visual Place Recognition (VPR), a pivotal component of long-term intelligent robotic vision (vision-aware localization and navigation systems). The prestigious generalization power of D-CNNs gained upon training on large scale places datasets and learned persistent image regions which are found to be robust for specific place recognition under changing conditions and camera viewpoints. However, against the computation and power intensive D-CNNs based VPR algorithms that are employed to determine the approximate location of resource-constrained mobile robots, lightweight VPR techniques are preferred. This paper presents a computation- and energy-efficient CAMAL framework that captures place-specific multi-layer convolutional attentions efficient for environment invariant-VPR. At 4x lesser power consumption, evaluating the proposed VPR framework on challenging benchmark place recognition datasets reveal better and comparable Area under Precision-Recall (AUC-PR) curves with approximately 4x improved image retrieval performance over the contemporary VPR methodologies.