arXiv reaDer
MoDA: カジュアルビデオからの変形可能な 3D オブジェクトのモデリング
MoDA: Modeling Deformable 3D Objects from Casual Videos
このペーパーでは、カジュアルなビデオから変形可能な 3D オブジェクトをモデリングするという課題に焦点を当てます。 Neural Radiance Field (NeRF) の人気に伴い、多くの作品が正準 NeRF と観察空間と正準空間の間の 3D 点変換を実現する変形モデルを使用して動的シーンに拡張しています。最近の研究では、線形ブレンド スキニング (LBS) を利用して正準観測変換を実現しています。ただし、線形に重み付けされた剛体変換行列の組み合わせが剛体であることは保証されません。実際のところ、予期しないスケール係数やせん断係数が現れることがよくあります。実際には、変形モデルとして LBS を使用すると、曲げたりひねったりする動作でスキンが崩壊するアーティファクトが常に発生する可能性があります。この問題を解決するために、スキン崩壊アーティファクトを発生させずに剛体変換を実行できる 3D ポイント変形を実現するニューラル デュアル クォータニオン ブレンド スキニング (NeuDBS) を提案します。異なるフレーム間で 2D ピクセルを登録する試みにおいて、最適トランスポート問題を解決することにより、正準空間内の 3D 点をエンコードする正準特徴埋め込みと 2D 画像特徴の間の対応関係を確立します。さらに、ターゲットの変形可能なオブジェクトの外側のノイズの多い色の影響を効果的に最小限に抑えるテクスチャ レンダリングのためのテクスチャ フィルタリング アプローチを導入します。実際のデータセットと合成データセットに関する広範な実験により、私たちのアプローチが最先端の方法よりも優れた定性的および定量的パフォーマンスで人間と動物の 3D モデルを再構築できることが示されています。
In this paper, we focus on the challenges of modeling deformable 3D objects from casual videos. With the popularity of neural radiance fields (NeRF), many works extend it to dynamic scenes with a canonical NeRF and a deformation model that achieves 3D point transformation between the observation space and the canonical space. Recent works rely on linear blend skinning (LBS) to achieve the canonical-observation transformation. However, the linearly weighted combination of rigid transformation matrices is not guaranteed to be rigid. As a matter of fact, unexpected scale and shear factors often appear. In practice, using LBS as the deformation model can always lead to skin-collapsing artifacts for bending or twisting motions. To solve this problem, we propose neural dual quaternion blend skinning (NeuDBS) to achieve 3D point deformation, which can perform rigid transformation without skin-collapsing artifacts. In the endeavor to register 2D pixels across different frames, we establish a correspondence between canonical feature embeddings that encodes 3D points within the canonical space, and 2D image features by solving an optimal transport problem. Besides, we introduce a texture filtering approach for texture rendering that effectively minimizes the impact of noisy colors outside target deformable objects. Extensive experiments on real and synthetic datasets show that our approach can reconstruct 3D models for humans and animals with better qualitative and quantitative performance than state-of-the-art methods.
updated: Sat May 27 2023 19:49:03 GMT+0000 (UTC)
published: Mon Apr 17 2023 13:49:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト