arXiv reaDer
画像から鳥瞰図を取得するための幾何学的アプローチ
A Geometric Approach to Obtain a Bird's Eye View from an Image
この論文の目的は、単眼画像を鳥の目(頭上)ビューに変換するホモグラフィ行列を計算することにより、単眼画像を修正することです。以下の貢献をします。(i)ホモグラフィ行列は、水平線と垂直消失点を指定する4つのパラメーターのみ、または視野または焦点距離がわかっている場合は2つのみでパラメーター化できることを示します。 (ii)畳み込みニューラルネットワーク(CNN)を使用した回帰に適した、線または点(無限大になる可能性があります)のジオメトリの新しい表現を紹介します。 (iii)直交消失点のグラウンドトゥルースを含む大規模な合成画像データセットを紹介します。これは、これらの幾何学的エンティティを予測するためのCNNのトレーニングに使用できます。そして最後に(iv)WildデータセットのHorizon Linesで74.52%のAUCを使用して、地平線検出に関する最先端の結果を達成します。私たちの方法は高速で堅牢であり、リアルタイムでビデオから遠近法の歪みを取り除くために使用できます。
The objective of this paper is to rectify any monocular image by computing a homography matrix that transforms it to a bird's eye (overhead) view. We make the following contributions: (i) we show that the homography matrix can be parameterised with only four parameters that specify the horizon line and the vertical vanishing point, or only two if the field of view or focal length is known; (ii) We introduce a novel representation for the geometry of a line or point (which can be at infinity) that is suitable for regression with a convolutional neural network (CNN); (iii) We introduce a large synthetic image dataset with ground truth for the orthogonal vanishing points, that can be used for training a CNN to predict these geometric entities; and finally (iv) We achieve state-of-the-art results on horizon detection, with 74.52% AUC on the Horizon Lines in the Wild dataset. Our method is fast and robust, and can be used to remove perspective distortion from videos in real time.
updated: Sun Sep 27 2020 19:15:16 GMT+0000 (UTC)
published: Mon May 06 2019 18:26:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト