arXiv reaDer
Lightweight Monocular Depth Estimation
単眼深度推定は、2D 画像からシーン ジオメトリを導出する問題に対処する上で重要な役割を果たすことができます。ロボット、自動運転車、シーン理解、3D 再構成など、さまざまな業界で使用されています。この方法の目標は、画像セグメンテーション ネットワークの Unet 構造を使用して、入力として単一の RGB 画像のみが与えられた場合に各ピクセルの深度値を予測するために、軽量の機械学習モデルを作成することです。 NYU Depth V2 データセットを使用して構造をテストし、結果を他の方法と比較します。提案された方法は、比較的高い精度と低い二乗平均平方根誤差を達成します。
Monocular depth estimation can play an important role in addressing the issue of deriving scene geometry from 2D images. It has been used in a variety of industries, including robots, self-driving cars, scene comprehension, 3D reconstructions, and others. The goal of our method is to create a lightweight machine-learning model in order to predict the depth value of each pixel given only a single RGB image as input with the Unet structure of the image segmentation network. We use the NYU Depth V2 dataset to test the structure and compare the result with other methods. The proposed method achieves relatively high accuracy and low rootmean-square error.
updated: Wed Dec 21 2022 21:05:16 GMT+0000 (UTC)
published: Wed Dec 21 2022 21:05:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト