arXiv reaDer
LED2-Net:微分可能な深度レンダリングによる単眼360レイアウト推定
LED2-Net: Monocular 360 Layout Estimation via Differentiable Depth Rendering
部屋のレイアウトの推定は大幅に進歩しましたが、ほとんどの方法は、3D空間の部屋の構造を利用するのではなく、2Dピクセル座標の損失を減らすことを目的としています。部屋のレイアウトを3Dで再構築するために、パノラマの地平線上の深度を予測する問題として、360レイアウト推定のタスクを定式化します。具体的には、レイアウトから深度予測への変換を微分可能にする微分可能深度レンダリング手順を提案します。これにより、グラウンドトゥルース深度を提供することなく、3D幾何学的情報を活用しながら、提案されたモデルをエンドツーエンドでトレーニング可能にします。私たちの方法は、多数の360レイアウトベンチマークデータセットで最先端のパフォーマンスを実現します。さらに、私たちの定式化により、深度データセットの事前トレーニングステップが可能になり、レイアウト推定モデルの一般化可能性がさらに向上します。
Although significant progress has been made in room layout estimation, most methods aim to reduce the loss in the 2D pixel coordinate rather than exploiting the room structure in the 3D space. Towards reconstructing the room layout in 3D, we formulate the task of 360 layout estimation as a problem of predicting depth on the horizon line of a panorama. Specifically, we propose the Differentiable Depth Rendering procedure to make the conversion from layout to depth prediction differentiable, thus making our proposed model end-to-end trainable while leveraging the 3D geometric information, without the need of providing the ground truth depth. Our method achieves state-of-the-art performance on numerous 360 layout benchmark datasets. Moreover, our formulation enables a pre-training step on the depth dataset, which further improves the generalizability of our layout estimation model.
updated: Sat Apr 03 2021 18:28:13 GMT+0000 (UTC)
published: Thu Apr 01 2021 15:48:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト