arXiv reaDer
欠落データのあるモーションからの深い非剛体構造
Deep Non-Rigid Structure from Motion with Missing Data
  動きからの非剛体構造(NRSfM)は、2D対応の画像の集合からカメラと非剛体オブジェクトの3D点群を再構築する問題を指します。現在のNRSfMアルゴリズムは、2つの観点から制限されています:(i)画像の数、および(ii)それらが処理できる形状変動のタイプ。これらの困難は、システムの状態とモデル化する必要がある自由度との間の固有の競合に起因します。これにより、ビジョン内の多くのアプリケーションでの実用性が妨げられています。この論文では、(i)および(ii)を克服できるNRSFMの新しい階層的スパースコーディングモデルを提案します。私たちのアプローチは、3D構造からポーズを解くことができる独自のアーキテクチャを備えた、教師なしディープニューラルネットワーク(DNN)自動エンコーダーのトレーニングとして実際に実現されています。最新のディープラーニング計算プラットフォームを使用すると、NRSfMの問題を前例のない規模と形状の複雑さで解決できます。このアプローチには3Dの監督がなく、2Dポイントの対応のみに依存しています。さらに、私たちのアプローチは、マトリックスの補完を必要とせずに、2Dポイントの欠落/閉塞を処理することもできます。広範な実験により、当社のアプローチの優れた性能が実証されており、場合によっては、入手可能なすべての最先端の作品に対して、桁違いに優れた精度と堅牢性を示しています。さらに、再構築可能性についての信頼性を確認するために、3Dのグランドトゥルースの必要性を回避する新しい品質尺度(ネットワークの重みに基づく)を提案します。私たちの仕事はNRSFMの最新技術を大きく上回るものになると信じています。
Non-Rigid Structure from Motion (NRSfM) refers to the problem of reconstructing cameras and the 3D point cloud of a non-rigid object from an ensemble of images with 2D correspondences. Current NRSfM algorithms are limited from two perspectives: (i) the number of images, and (ii) the type of shape variability they can handle. These difficulties stem from the inherent conflict between the condition of the system and the degrees of freedom needing to be modeled -- which has hampered its practical utility for many applications within vision. In this paper we propose a novel hierarchical sparse coding model for NRSFM which can overcome (i) and (ii) to such an extent, that NRSFM can be applied to problems in vision previously thought too ill posed. Our approach is realized in practice as the training of an unsupervised deep neural network (DNN) auto-encoder with a unique architecture that is able to disentangle pose from 3D structure. Using modern deep learning computational platforms allows us to solve NRSfM problems at an unprecedented scale and shape complexity. Our approach has no 3D supervision, relying solely on 2D point correspondences. Further, our approach is also able to handle missing/occluded 2D points without the need for matrix completion. Extensive experiments demonstrate the impressive performance of our approach where we exhibit superior precision and robustness against all available state-of-the-art works in some instances by an order of magnitude. We further propose a new quality measure (based on the network weights) which circumvents the need for 3D ground-truth to ascertain the confidence we have in the reconstructability. We believe our work to be a significant advance over state-of-the-art in NRSFM.
updated: Fri Sep 06 2019 18:46:07 GMT+0000 (UTC)
published: Tue Jul 30 2019 00:35:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト