arXiv reaDer
高密度 3D ビジョン タスクのための正確なジオメトリ データの重要性について
On the Importance of Accurate Geometry Data for Dense 3D Vision Tasks
高密度 3D ビジョンの問題を解決するための学習ベースの方法は、通常、3D センサー データでトレーニングされます。それぞれ使用される距離測定の原理には、利点と欠点があります。これらは通常、マルチモーダル データセットがないため、文献で比較も議論もされていません。テクスチャのない領域は、モーションやステレオからの構造に問題があり、反射素材はアクティブ センシングに問題を引き起こし、半透明のオブジェクトの距離は、既存のハードウェアで測定するのが複雑です。不正確または破損したデータでのトレーニングは、モデルのバイアスを誘発し、一般化機能を妨げます。評価中にセンサー測定値がグラウンド トゥルースと見なされる場合、これらの影響は見過ごされます。この論文では、深度推定と再構成の高密度 3D ビジョン タスクに対するセンサー エラーの影響を調査します。学習した予測に対するセンサー特性の重大な影響を厳密に示し、日常の家庭環境でのさまざまな技術から生じる一般化の問題に気づきます。評価のために、https://github.com/Junggy/HAMMER-dataset で入手できる慎重に設計されたデータセットdataset を紹介します。これには、D-ToF、I-ToF、パッシブ/アクティブ ステレオ、単眼 RGB+P などのコモディティ センサーからの測定値が含まれます。私たちの研究は、かなりのセンサーノイズの影響を定量化し、高密度ビジョン推定の改善と対象を絞ったデータ融合への道を開きます。
Learning-based methods to solve dense 3D vision problems typically train on 3D sensor data. The respectively used principle of measuring distances provides advantages and drawbacks. These are typically not compared nor discussed in the literature due to a lack of multi-modal datasets. Texture-less regions are problematic for structure from motion and stereo, reflective material poses issues for active sensing, and distances for translucent objects are intricate to measure with existing hardware. Training on inaccurate or corrupt data induces model bias and hampers generalisation capabilities. These effects remain unnoticed if the sensor measurement is considered as ground truth during the evaluation. This paper investigates the effect of sensor errors for the dense 3D vision tasks of depth estimation and reconstruction. We rigorously show the significant impact of sensor characteristics on the learned predictions and notice generalisation issues arising from various technologies in everyday household environments. For evaluation, we introduce a carefully designed datasetdataset available at https://github.com/Junggy/HAMMER-dataset comprising measurements from commodity sensors, namely D-ToF, I-ToF, passive/active stereo, and monocular RGB+P. Our study quantifies the considerable sensor noise impact and paves the way to improved dense vision estimates and targeted data fusion.
updated: Sun Mar 26 2023 22:32:44 GMT+0000 (UTC)
published: Sun Mar 26 2023 22:32:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト