arXiv reaDer
RGBD-GAN:自然画像データセットからのRGBD画像合成による教師なし3D表現学習
RGBD-GAN: Unsupervised 3D Representation Learning From Natural Image Datasets via RGBD Image Synthesis
 ラベル付けされた情報なしで2次元(2D)画像から3次元(3D)形状を理解することは、注釈コストを発生させずに現実世界を理解するために有望です。ここでは、2D画像から教師なし3D表現学習を実現する新しい生成モデルRGBD-GANを提案します。提案された方法は、カメラのポーズや深度などの3Dアノテーションなしで、カメラのパラメーター条件付き画像生成と深度画像生成を可能にします。通常のGAN対物レンズに加えて、異なるカメラパラメーターから生成された2つのRGBD画像に明示的な3D整合性損失を使用します。損失は単純ですが、DCGANやStyleGANなどの任意のタイプの画像ジェネレーターをカメラパラメーターで調整するのに効果的です。実験を通じて、提案された方法がさまざまなジェネレータアーキテクチャを使用して2D画像から3D表現を学習できることを示しました。
Understanding three-dimensional (3D) geometries from two-dimensional (2D) images without any labeled information is promising for understanding the real world without incurring annotation cost. We herein propose a novel generative model, RGBD-GAN, which achieves unsupervised 3D representation learning from 2D images. The proposed method enables camera parameter-conditional image generation and depth image generation without any 3D annotations, such as camera poses or depth. We use an explicit 3D consistency loss for two RGBD images generated from different camera parameters, in addition to the ordinal GAN objective. The loss is simple yet effective for any type of image generator such as DCGAN and StyleGAN to be conditioned on camera parameters. Through experiments, we demonstrated that the proposed method could learn 3D representations from 2D images with various generator architectures.
updated: Mon May 25 2020 00:18:28 GMT+0000 (UTC)
published: Fri Sep 27 2019 09:10:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト