視覚的な場所認識のための最新のアルゴリズムと関連する視覚ナビゲーションシステムは、2つのカテゴリに大きく分けることができます:深層学習を含むコンピューター科学指向モデルまたは生物学的妥当性が最小限の画像検索ベースの手法、および神経科学脳内の空間ナビゲーションの基礎となる時間的特性をモデル化する指向性動的ネットワーク。この手紙では、この格差を初めて埋めるコンパクトで高性能な新しい場所認識モデルを提案します。私たちのアプローチは、これらのカテゴリの2つの主要なニューラルモデルで構成されています:(1)ショウジョウバエの脳のアーキテクチャに触発されたコンパクトでまばらな2層ニューラルネットワーク、Drosophila melanogaster、および(2)1次元連続アトラクターニューラルネットワーク(CANN) )。結果として得られるFlyNet + CANNネットワークには、FlyNetモデルのコンパクトなパターン認識機能と同等のコンパクトなCANNの強力な時間フィルタリング機能が組み込まれ、SeqSLAMのようなアルゴリズムのローカリゼーションアプローチで高いパフォーマンスをもたらす機能をハイブリッドニューラル実装で完全に複製します。モデルを評価し、3つの最新の手法と比較します.2つのベンチマークの実際の世界のデータセットで、視点のばらつきが小さく、極端な環境変化があります-昼から夜への移行では87%のAUC結果を達成しますマルチプロセスフュージョン、LoST-Xで46%、SeqSLAMで1%、それぞれ6.5、310、1.5倍高速。
State-of-the-art algorithms for visual place recognition, and related visual navigation systems, can be broadly split into two categories: computer-science-oriented models including deep learning or image retrieval-based techniques with minimal biological plausibility, and neuroscience-oriented dynamical networks that model temporal properties underlying spatial navigation in the brain. In this letter, we propose a new compact and high-performing place recognition model that bridges this divide for the first time. Our approach comprises two key neural models of these categories: (1) FlyNet, a compact, sparse two-layer neural network inspired by brain architectures of fruit flies, Drosophila melanogaster, and (2) a one-dimensional continuous attractor neural network (CANN). The resulting FlyNet+CANN network incorporates the compact pattern recognition capabilities of our FlyNet model with the powerful temporal filtering capabilities of an equally compact CANN, replicating entirely in a hybrid neural implementation the functionality that yields high performance in algorithmic localization approaches like SeqSLAM. We evaluate our model, and compare it to three state-of-the-art methods, on two benchmark real-world datasets with small viewpoint variations and extreme environmental changes - achieving 87% AUC results under day to night transitions compared to 60% for Multi-Process Fusion, 46% for LoST-X and 1% for SeqSLAM, while being 6.5, 310, and 1.5 times faster, respectively.