arXiv reaDer
オブジェクトの視差
Object Disparity
ステレオビジョン作品のほとんどは、左右の画像の特定のペアの高密度ピクセル視差の計算に焦点を合わせています。カメラペアは通常、正確な高密度ピクセル視差計算のために歪みのないエピポーララインキャリブレーションされた画像ペアを提供するために、レンズの歪みのないステレオキャリブレーションを必要としました。ノイズ、オブジェクトのオクルージョン、テクスチャの繰り返しまたは欠如、およびマッチングアルゴリズムの制限により、ピクセルの視差の精度は通常、これらのオブジェクトの境界領域で最も影響を受けます。統計的にはピクセル視差エラーの総数は少ないかもしれませんが(現在のトップランキングアルゴリズムのKitti Visionベンチマークによると2%未満)、オブジェクト境界でのこれらの視差エラーの割合は非常に高くなっています。これにより、サブシーケンスの3Dオブジェクト距離検出が必要な精度よりもはるかに低くなります。この論文は、高密度ピクセル視差計算を経ることなく、物体視差を直接検出することによって、3D物体距離検出を解決するための異なるアプローチを提案した。 squeezenet Object Disparity-SSD(OD-SSD)の例は、Kittiデータセットのピクセル視差グラウンドトゥルースと比較して同等の精度で効率的なオブジェクト視差検出を実証するために構築されました。いくつかの異なるステレオシステムによってキャプチャされた混合画像データセットを使用したさらなるトレーニングとテストの結果は、OD-SSDがベースライン、FOV、レンズの歪み、さらには左右のカメラのエピポーララインの不整合などのステレオシステムパラメータに依存しない可能性があることを示唆している可能性があります。
Most of stereo vision works are focusing on computing the dense pixel disparity of a given pair of left and right images. A camera pair usually required lens undistortion and stereo calibration to provide an undistorted epipolar line calibrated image pair for accurate dense pixel disparity computation. Due to noise, object occlusion, repetitive or lack of texture and limitation of matching algorithms, the pixel disparity accuracy usually suffers the most at those object boundary areas. Although statistically the total number of pixel disparity errors might be low (under 2% according to the Kitti Vision Benchmark of current top ranking algorithms), the percentage of these disparity errors at object boundaries are very high. This renders the subsequence 3D object distance detection with much lower accuracy than desired. This paper proposed a different approach for solving a 3D object distance detection by detecting object disparity directly without going through a dense pixel disparity computation. An example squeezenet Object Disparity-SSD (OD-SSD) was constructed to demonstrate an efficient object disparity detection with comparable accuracy compared with Kitti dataset pixel disparity ground truth. Further training and testing results with mixed image dataset captured by several different stereo systems may suggest that an OD-SSD might be agnostic to stereo system parameters such as a baseline, FOV, lens distortion, even left/right camera epipolar line misalignment.
updated: Wed Aug 18 2021 02:11:28 GMT+0000 (UTC)
published: Wed Aug 18 2021 02:11:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト