arXiv reaDer
単眼視覚オドメトリのディープオンライン補正
Deep Online Correction for Monocular Visual Odometry
この作業では、単眼視覚オドメトリのための新しいディープオンライン補正(DOC)フレームワークを提案します。パイプライン全体には2つの段階があります。最初に、深度マップと初期ポーズは、自己監視方式でトレーニングされた畳み込みニューラルネットワーク(CNN)から取得されます。第二に、CNNによって予測されたポーズは、推論フェーズ中のポーズの勾配更新を介して測光エラーを最小限に抑えることによってさらに改善されます。提案された方法の利点は2つあります。1)オンライン学習方法とは異なり、DOCはCNNのパラメーターの勾配伝搬を計算する必要がありません。したがって、推論フェーズでより多くの計算リソースを節約できます。 2)CNNを従来の方法と組み合わせるハイブリッド方法とは異なり、DOCはディープラーニング(DL)フレームワークに完全に依存しています。複雑なバックエンド最適化モジュールがない場合でも、私たちの方法は、SeqのKITTIオドメトリベンチマークで相対変換誤差(RTE)= 2.0%で卓越したパフォーマンスを達成します。 09は、従来の単眼VOフレームワークよりも優れており、ハイブリッド方式に匹敵します。
In this work, we propose a novel deep online correction (DOC) framework for monocular visual odometry. The whole pipeline has two stages: First, depth maps and initial poses are obtained from convolutional neural networks (CNNs) trained in self-supervised manners. Second, the poses predicted by CNNs are further improved by minimizing photometric errors via gradient updates of poses during inference phases. The benefits of our proposed method are twofold: 1) Different from online-learning methods, DOC does not need to calculate gradient propagation for parameters of CNNs. Thus, it saves more computation resources during inference phases. 2) Unlike hybrid methods that combine CNNs with traditional methods, DOC fully relies on deep learning (DL) frameworks. Though without complex back-end optimization modules, our method achieves outstanding performance with relative transform error (RTE) = 2.0% on KITTI Odometry benchmark for Seq. 09, which outperforms traditional monocular VO frameworks and is comparable to hybrid methods.
updated: Thu Mar 18 2021 05:55:51 GMT+0000 (UTC)
published: Thu Mar 18 2021 05:55:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト