arXiv reaDer
深部深度予測と視覚的SLAMのオンライン相互適応
Online Mutual Adaptation of Deep Depth Prediction and Visual SLAM
畳み込みニューラルネットワーク(CNN)による正確な深度予測の機能は、強化されたカメラ追跡や高密度マッピングなどの実用的な視覚的同時位置特定およびマッピング(SLAM)アプリケーションで広く使用されるための主要な課題です。このペーパーは、次の質問に答えることを目的としています。SLAMのパフォーマンスを向上させるために、CNNが現在の動作環境用にトレーニングされていない場合でも、視覚的なSLAMアルゴリズムを使用して深度予測CNNを調整できますか?この目的のために、2つの補完的なプロセスで構成される新しいオンライン適応フレームワークを提案します。キーフレームを生成して深度予測を微調整するために使用されるSLAMアルゴリズムと、オンライン適応深度を使用してマップの品質を向上させる別のアルゴリズムです。ノイズの多い可能性のあるマップポイントが削除されたら、グローバル測光バンドル調整(BA)を実行して、全体的なSLAMパフォーマンスを向上させます。ベンチマークデータセットと私たち自身の実験環境での実際のロボットの両方での実験結果は、提案された方法が全体的なSLAM精度を改善することを示しています。正則化はマルチタスク分類問題で効果的であることが示されていますが、実験結果とアブレーション研究を提示して、単一タスク回帰問題である深度予測のオンライン適応における壊滅的な忘却の防止における正則化の有効性を示します。さらに、オンライン適応フレームワークを最新の事前トレーニング済み深度予測CNNと比較して、オンライン適応深度予測CNNが、データセットの大規模なコレクションでトレーニングされた深度予測CNNよりも優れていることを示します。
The ability of accurate depth prediction by a convolutional neural network (CNN) is a major challenge for its wide use in practical visual simultaneous localization and mapping (SLAM) applications, such as enhanced camera tracking and dense mapping. This paper is set out to answer the following question: Can we tune a depth prediction CNN with the help of a visual SLAM algorithm even if the CNN is not trained for the current operating environment in order to benefit the SLAM performance? To this end, we propose a novel online adaptation framework consisting of two complementary processes: a SLAM algorithm that is used to generate keyframes to fine-tune the depth prediction and another algorithm that uses the online adapted depth to improve map quality. Once the potential noisy map points are removed, we perform global photometric bundle adjustment (BA) to improve the overall SLAM performance. Experimental results on both benchmark datasets and a real robot in our own experimental environments show that our proposed method improves the overall SLAM accuracy. While regularization has been shown to be effective in multi-task classification problems, we present experimental results and an ablation study to show the effectiveness of regularization in preventing catastrophic forgetting in the online adaptation of depth prediction, a single-task regression problem. In addition, we compare our online adaptation framework against the state-of-the-art pre-trained depth prediction CNNs to show that our online adapted depth prediction CNN outperforms the depth prediction CNNs that have been trained on a large collection of datasets.
updated: Tue Feb 01 2022 17:48:28 GMT+0000 (UTC)
published: Sun Nov 07 2021 14:20:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト