arXiv reaDer
Pix2Point:スパースポイントクラウドと最適なトランスポートを使用した屋外3Dの学習
Pix2Point: Learning Outdoor 3D Using Sparse Point Clouds and Optimal Transport
シーンの高品質な再構成と理解は、3D推定方法に依存しています。 3D情報は通常、ステレオ写真測量によって画像から取得されましたが、最近、深層学習により、単眼深度推定の優れた結果が得られました。これらの結果を達成するために十分に大きくて豊富なトレーニングデータセットを構築するには、面倒な処理が必要です。この論文では、スパースグラウンドトゥルースデータセットを使用して、単眼データから屋外の3D点群を学習する問題に対処します。完全でやりがいのある屋外シーンを処理できる、単眼3D点群予測のためのディープラーニングベースのアプローチであるPix2Pointを提案します。私たちの方法は、2D-3Dハイブリッドニューラルネットワークアーキテクチャと、点群間の最適な輸送発散の教師ありエンドツーエンド最小化に依存しています。疎な点群でトレーニングすると、単純な有望なアプローチにより、効率的な単眼深度法よりも3D屋外シーンのカバレッジが向上することを示します。
Good quality reconstruction and comprehension of a scene rely on 3D estimation methods. The 3D information was usually obtained from images by stereo-photogrammetry, but deep learning has recently provided us with excellent results for monocular depth estimation. Building up a sufficiently large and rich training dataset to achieve these results requires onerous processing. In this paper, we address the problem of learning outdoor 3D point cloud from monocular data using a sparse ground-truth dataset. We propose Pix2Point, a deep learning-based approach for monocular 3D point cloud prediction, able to deal with complete and challenging outdoor scenes. Our method relies on a 2D-3D hybrid neural network architecture, and a supervised end-to-end minimisation of an optimal transport divergence between point clouds. We show that, when trained on sparse point clouds, our simple promising approach achieves a better coverage of 3D outdoor scenes than efficient monocular depth methods.
updated: Fri Jul 30 2021 09:03:39 GMT+0000 (UTC)
published: Fri Jul 30 2021 09:03:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト