3D再構成は長年の不適切な問題であり、コンピュータービジョン、コンピューターグラフィックス、および機械学習のコミュニティによって数十年にわたって調査されてきました。 2015年以降、畳み込みニューラルネットワーク(CNN)を使用した画像ベースの3D再構成は、ますます関心を集め、印象的なパフォーマンスを示しています。この急速な進化の新時代を考えると、この記事では、この分野における最近の開発の包括的な調査を提供します。ディープラーニング技術を使用して、単一または複数のRGB画像から汎用オブジェクトの3D形状を推定する作業に焦点を当てています。形状表現、ネットワークアーキテクチャ、およびそれらが使用するトレーニングメカニズムに基づいて文献を整理します。この調査は、一般的なオブジェクトを再構築する方法を対象としていますが、人体の形や顔などの特定のオブジェクトクラスに焦点を当てた最近の作品の一部も確認します。いくつかの重要な論文のパフォーマンスの分析と比較を提供し、この分野の未解決の問題のいくつかを要約し、将来の研究の有望な方向性について議論します。
3D reconstruction is a longstanding ill-posed problem, which has been explored for decades by the computer vision, computer graphics, and machine learning communities. Since 2015, image-based 3D reconstruction using convolutional neural networks (CNN) has attracted increasing interest and demonstrated an impressive performance. Given this new era of rapid evolution, this article provides a comprehensive survey of the recent developments in this field. We focus on the works which use deep learning techniques to estimate the 3D shape of generic objects either from a single or multiple RGB images. We organize the literature based on the shape representations, the network architectures, and the training mechanisms they use. While this survey is intended for methods which reconstruct generic objects, we also review some of the recent works which focus on specific object classes such as human body shapes and faces. We provide an analysis and comparison of the performance of some key papers, summarize some of the open problems in this field, and discuss promising directions for future research.