arXiv reaDer
オープンワールドへの一般化:オンライン適応によるディープビジュアルオドメトリ
Generalizing to the Open World: Deep Visual Odometry with Online Adaptation
学習ベースの視覚オドメトリ(VO)は近年印象的な結果を示していますが、事前にトレーニングされたネットワークは、目に見えない環境では簡単に崩壊する可能性があります。トレーニングデータとテストデータの間のドメインギャップが大きいため、新しいシーンに一般化することは困難です。この論文では、シーンにとらわれない幾何学的計算とベイズ推定の助けを借りて、深いVOのためのオンライン適応フレームワークを提案します。学習ベースのポーズ推定とは対照的に、私たちの方法は、オプティカルフローと深度からポーズを解決しますが、単一ビューの深度推定は、オンラインで学習した不確実性による新しい観測によって継続的に改善されます。一方、オンラインで学習した測光の不確実性は、微分可能なガウス-ニュートン層による深度とポーズの最適化に使用されます。私たちの方法は、自己監視方式で、深いVOネットワークを目に見えない環境に迅速に適応させることを可能にします。 CityscapesからKITTIおよび屋外KITTIから屋内TUMを含む広範な実験は、私たちの方法が自己監視VO方法の中で最先端の一般化能力を達成することを示しています。
Despite learning-based visual odometry (VO) has shown impressive results in recent years, the pretrained networks may easily collapse in unseen environments. The large domain gap between training and testing data makes them difficult to generalize to new scenes. In this paper, we propose an online adaptation framework for deep VO with the assistance of scene-agnostic geometric computations and Bayesian inference. In contrast to learning-based pose estimation, our method solves pose from optical flow and depth while the single-view depth estimation is continuously improved with new observations by online learned uncertainties. Meanwhile, an online learned photometric uncertainty is used for further depth and pose optimization by a differentiable Gauss-Newton layer. Our method enables fast adaptation of deep VO networks to unseen environments in a self-supervised manner. Extensive experiments including Cityscapes to KITTI and outdoor KITTI to indoor TUM demonstrate that our method achieves state-of-the-art generalization ability among self-supervised VO methods.
updated: Mon Mar 29 2021 02:13:56 GMT+0000 (UTC)
published: Mon Mar 29 2021 02:13:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト