arXiv reaDer
広角画像の平行化:調査
Wide-angle Image Rectification: A Survey
狭いFOVカメラよりも広いシーンエリアをキャプチャする広い視野(FOV)カメラは、3D再構築、自動運転、ビデオ監視などの多くのアプリケーションで使用されます。ただし、広角画像には、ピンホールカメラモデルの基礎となる仮定に違反する歪みが含まれているため、オブジェクトの歪み、シーンの距離、面積、方向の推定が困難になり、歪みのない画像でトレーニングされた既製のディープモデルを使用できなくなります。ダウンストリームコンピュータビジョンタスク。これらの歪みを補正することを目的とした画像補正は、これらの問題を解決することができます。本論文では、変換モデルから修正方法までの広角画像修正の進歩を包括的に調査した。具体的には、最初に、さまざまなアプローチで使用されるカメラモデルの詳細な説明と説明を示します。次に、ラジアルディストーションとプロジェクションディストーションを含むいくつかのディストーションモデルを要約します。次に、従来のジオメトリベースの画像修正方法とディープラーニングベースの方法の両方を確認します。前者は歪みパラメータ推定を最適化問題として定式化し、後者はディープニューラルネットワークの能力を活用して回帰問題として扱います。公開データセットに対する最先端の方法のパフォーマンスを評価し、両方の種類の方法で良好な結果を得ることができますが、これらの方法は特定のカメラモデルと歪みタイプに対してのみ適切に機能することを示しています。また、強力なベースラインモデルを提供し、合成データセットと実世界の広角画像でさまざまな歪みモデルの実証的研究を実施します。最後に、将来この分野をさらに前進させることが期待されるいくつかの潜在的な研究の方向性について説明します。
Wide field-of-view (FOV) cameras, which capture a larger scene area than narrow FOV cameras, are used in many applications including 3D reconstruction, autonomous driving, and video surveillance. However, wide-angle images contain distortions that violate the assumptions underlying pinhole camera models, resulting in object distortion, difficulties in estimating scene distance, area, and direction, and preventing the use of off-the-shelf deep models trained on undistorted images for downstream computer vision tasks. Image rectification, which aims to correct these distortions, can solve these problems. In this paper, we comprehensively survey progress in wide-angle image rectification from transformation models to rectification methods. Specifically, we first present a detailed description and discussion of the camera models used in different approaches. Then, we summarize several distortion models including radial distortion and projection distortion. Next, we review both traditional geometry-based image rectification methods and deep learning-based methods, where the former formulate distortion parameter estimation as an optimization problem and the latter treat it as a regression problem by leveraging the power of deep neural networks. We evaluate the performance of state-of-the-art methods on public datasets and show that although both kinds of methods can achieve good results, these methods only work well for specific camera models and distortion types. We also provide a strong baseline model and carry out an empirical study of different distortion models on synthetic datasets and real-world wide-angle images. Finally, we discuss several potential research directions that are expected to further advance this area in the future.
updated: Wed Dec 01 2021 12:24:03 GMT+0000 (UTC)
published: Fri Oct 30 2020 17:28:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト