arXiv reaDer
ホモグラフィによる未校正の交通カメラを使用した単眼3D車両検出
Monocular 3D Vehicle Detection Using Uncalibrated Traffic Cameras through Homography
本論文は、単一の交通カメラから3D世界における車両の位置と姿勢を抽出する方法を提案する。以前のほとんどの単眼3D車両検出アルゴリズムは、ドライバーの視点から車両のカメラに焦点を当てており、既知の内因性および外因性のキャリブレーションを想定していました。それどころか、この論文は、未校正の単眼交通カメラを使用した同じタスクに焦点を当てています。道路面と画像面の間のホモグラフィは、このタスクの3D車両検出とデータ合成に不可欠であり、カメラの内因性と外因性がなくてもホモグラフィを推定できることがわかります。逆遠近法マッピングから生成された鳥瞰図(BEV)画像で回転した境界ボックス(rボックス)を推定することにより、3D車両検出を実行します。テール付きr-boxと呼ばれる新しい回帰ターゲットと、歪んだBEV画像の検出精度を高めるデュアルビューネットワークアーキテクチャを提案します。実験は、提案された方法が、トレーニング中にそれらから画像化されていないにもかかわらず、新しいカメラおよび環境のセットアップに一般化できることを示しています。
This paper proposes a method to extract the position and pose of vehicles in the 3D world from a single traffic camera. Most previous monocular 3D vehicle detection algorithms focused on cameras on vehicles from the perspective of a driver, and assumed known intrinsic and extrinsic calibration. On the contrary, this paper focuses on the same task using uncalibrated monocular traffic cameras. We observe that the homography between the road plane and the image plane is essential to 3D vehicle detection and the data synthesis for this task, and the homography can be estimated without the camera intrinsics and extrinsics. We conduct 3D vehicle detection by estimating the rotated bounding boxes (r-boxes) in the bird's eye view (BEV) images generated from inverse perspective mapping. We propose a new regression target called tailed r-box and a dual-view network architecture which boosts the detection accuracy on warped BEV images. Experiments show that the proposed method can generalize to new camera and environment setups despite not seeing imaged from them during training.
updated: Tue Jan 04 2022 22:43:34 GMT+0000 (UTC)
published: Mon Mar 29 2021 02:57:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト