arXiv reaDer
学習ベースの視覚オドメトリを使用した動的高密度RGB-DSLAM
Dynamic Dense RGB-D SLAM using Learning-based Visual Odometry
学習ベースの視覚オドメトリ、TartanVOに基づく高密度ダイナミックRGB-DSLAMパイプラインを提案します。 TartanVOは、機能ベースではなく他の直接的な方法と同様に、静的なシーンにのみ適用され、動的なオブジェクトを無視する高密度のオプティカルフローを通じてカメラのポーズを推定します。色覚恒常性を前提としているため、オプティカルフローは動的ピクセルと静的ピクセルを区別できません。したがって、このような直接的な方法で静的マップを再構築するために、パイプラインはオプティカルフロー出力を利用して動的/静的セグメンテーションを解決し、静的ポイントのみをマップに融合します。さらに、動的ピクセルが削除されるように入力フレームを再レンダリングし、それらを視覚オドメトリに繰り返し渡して、ポーズの推定を調整します。
We propose a dense dynamic RGB-D SLAM pipeline based on a learning-based visual odometry, TartanVO. TartanVO, like other direct methods rather than feature-based, estimates camera pose through dense optical flow, which only applies to static scenes and disregards dynamic objects. Due to the color constancy assumption, optical flow is not able to differentiate between dynamic and static pixels. Therefore, to reconstruct a static map through such direct methods, our pipeline resolves dynamic/static segmentation by leveraging the optical flow output, and only fuse static points into the map. Moreover, we rerender the input frames such that the dynamic pixels are removed and iteratively pass them back into the visual odometry to refine the pose estimate.
updated: Thu May 12 2022 07:11:41 GMT+0000 (UTC)
published: Thu May 12 2022 07:11:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト