arXiv reaDer
TOF-StereoFusionに基づく高解像度深度マップ
High-Resolution Depth Maps Based on TOF-Stereo Fusion
距離センサーとカラーカメラの組み合わせは、ロボットナビゲーション、意味認識、操作、およびテレプレゼンスに非常に役立ちます。範囲データと色データを組み合わせるいくつかの方法が調査され、さまざまなロボットアプリケーションで正常に使用されています。これらのシステムのほとんどは、現在の距離センサーの解像度がカラーカメラの解像度よりもはるかに低いため、距離データのノイズと距離センサーとカラーカメラ間の解像度の不一致の問題に悩まされています。高解像度の深度マップはステレオマッチングを使用して取得できますが、これでは、テクスチャが弱い/繰り返しのシーンの正確な深度マップを作成できない場合や、シーンが複雑な自己閉塞を示す場合に失敗することがよくあります。距離センサーは、テクスチャの有無に関係なく、粗い深度情報を提供します。飛行時間型(TOF)カメラとステレオスコピックカメラペアで構成されるキャリブレーションされたシステムを使用すると、データの融合が可能になり、両方の個々のセンサーの弱点を克服できます。対応の初期セットとしてステレオ画像ペアに投影されたTOFデータを使用する効率的なシード成長アルゴリズムに基づく新しいTOF-ステレオ融合法を提案します。次に、これらの初期「シード」は、画像の類似性スコアと低解像度の範囲データから計算された大まかな深度事前分布を組み合わせたベイズモデルに基づいて伝播されます。全体的な結果は、手元のカラーカメラの解像度での高密度で正確な深度マップです。提案されたアルゴリズムが2D画像ベースのステレオアルゴリズムよりも優れていること、および結果が市販のカラーレンジセンサー(Kinectなど)よりも高い解像度であることを示します。さらに、このアルゴリズムは、単一のCPUでリアルタイムのパフォーマンスを発揮する可能性があります。
The combination of range sensors with color cameras can be very useful for robot navigation, semantic perception, manipulation, and telepresence. Several methods of combining range- and color-data have been investigated and successfully used in various robotic applications. Most of these systems suffer from the problems of noise in the range-data and resolution mismatch between the range sensor and the color cameras, since the resolution of current range sensors is much less than the resolution of color cameras. High-resolution depth maps can be obtained using stereo matching, but this often fails to construct accurate depth maps of weakly/repetitively textured scenes, or if the scene exhibits complex self-occlusions. Range sensors provide coarse depth information regardless of presence/absence of texture. The use of a calibrated system, composed of a time-of-flight (TOF) camera and of a stereoscopic camera pair, allows data fusion thus overcoming the weaknesses of both individual sensors. We propose a novel TOF-stereo fusion method based on an efficient seed-growing algorithm which uses the TOF data projected onto the stereo image pair as an initial set of correspondences. These initial "seeds" are then propagated based on a Bayesian model which combines an image similarity score with rough depth priors computed from the low-resolution range data. The overall result is a dense and accurate depth map at the resolution of the color cameras at hand. We show that the proposed algorithm outperforms 2D image-based stereo algorithms and that the results are of higher resolution than off-the-shelf color-range sensors, e.g., Kinect. Moreover, the algorithm potentially exhibits real-time performance on a single CPU.
updated: Fri Jul 30 2021 15:11:42 GMT+0000 (UTC)
published: Fri Jul 30 2021 15:11:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト