arXiv reaDer
カメラの動きと物体検出からの深さ
Depth from Camera Motion and Object Detection
このホワイトペーパーでは、カメラの動きをある程度測定して(ロボットの運動学や車両のオドメトリなどから)、検出されたオブジェクトの深さを推定する方法を学習する問題について説明します。これは、1)境界ボックスと未調整のカメラの動きの一般化された表現を使用してオブジェクトの深さを推定するリカレントニューラルネットワーク(DBox)を設計し、2)モーションおよび検出データセット(ODMD)を介してオブジェクトの深さを導入することによって実現します。 ODMDトレーニングデータは拡張可能で構成可能であり、ODMDベンチマークには4つの検証セットとテストセットにわたる21,600の例が含まれています。これらのセットには、エンドエフェクタカメラを使用してYCBデータセットからオブジェクトを特定するモバイルロボットの実験と、カメラの動きまたはバウンディングボックスデータに摂動が追加された例が含まれています。 ODMDベンチマークに加えて、他の単眼アプリケーションドメインでDBoxを評価し、既存の運転およびロボット工学のベンチマークで最先端の結果を達成し、カメラ付き携帯電話を使用してオブジェクトの深さを推定します。
This paper addresses the problem of learning to estimate the depth of detected objects given some measurement of camera motion (e.g., from robot kinematics or vehicle odometry). We achieve this by 1) designing a recurrent neural network (DBox) that estimates the depth of objects using a generalized representation of bounding boxes and uncalibrated camera movement and 2) introducing the Object Depth via Motion and Detection Dataset (ODMD). ODMD training data are extensible and configurable, and the ODMD benchmark includes 21,600 examples across four validation and test sets. These sets include mobile robot experiments using an end-effector camera to locate objects from the YCB dataset and examples with perturbations added to camera motion or bounding box data. In addition to the ODMD benchmark, we evaluate DBox in other monocular application domains, achieving state-of-the-art results on existing driving and robotics benchmarks and estimating the depth of objects using a camera phone.
updated: Tue Mar 02 2021 04:43:17 GMT+0000 (UTC)
published: Tue Mar 02 2021 04:43:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト