arXiv reaDer
Shape My Face:Surface-to-SurfaceTranslationによる3D顔スキャンの登録
Shape My Face: Registering 3D Face Scans by Surface-to-Surface Translation
慎重な前処理と手作業による調整に続いて、標準の登録アルゴリズムを各サーフェスに個別に適用して登録する必要があります。最近、学習ベースのアプローチが登場し、新しいスキャンの登録を、以前にトレーニングされたモデルで推論を実行するように減らしています。この論文では、登録タスクを表面から表面への平行移動問題としてキャストし、生の3D顔スキャンから直接潜在的な幾何学的情報を確実にキャプチャするモデルを設計します。 Shape-My-Face(SMF)、改良されたポイントクラウドエンコーダーに基づく強力なエンコーダーデコーダーアーキテクチャ、新しい視覚的注意メカニズム、スキップ接続を備えたグラフ畳み込みデコーダー、およびメッシュとスムーズに統合する特殊な口モデルを紹介します畳み込み。顔スキャンの非厳密な登録のための以前の最先端の学習アルゴリズムと比較して、SMFは、生データを事前定義された顔テンプレートと厳密に位置合わせする(スケーリングを使用する)必要があるだけです。さらに、私たちのモデルは、最小限の監視でトポロジー的に健全なメッシュを提供し、トレーニング時間を短縮し、トレーニング可能なパラメーターが桁違いに少なく、ノイズに対してより堅牢であり、以前は見られなかったデータセットに一般化できます。私たちは、さまざまなデータの登録の質を広範囲に評価します。さまざまなモダリティ、センサータイプ、解像度にわたる実際の顔スキャンを使用して、モデルの堅牢性と一般化可能性を示します。最後に、スキャンの登録を学習することにより、SMFが線形および非線形のハイブリッドモーフィング可能モデルを生成することを示します。 SMFの潜在空間を操作することで、形状の生成や、実際の表現の転送などのモーフィングアプリケーションが可能になります。コモディティハードウェア上の9つの大規模データベースで構成される人間の顔のデータセットでSMFをトレーニングします。
Standard registration algorithms need to be independently applied to each surface to register, following careful pre-processing and hand-tuning. Recently, learning-based approaches have emerged that reduce the registration of new scans to running inference with a previously-trained model. In this paper, we cast the registration task as a surface-to-surface translation problem, and design a model to reliably capture the latent geometric information directly from raw 3D face scans. We introduce Shape-My-Face (SMF), a powerful encoder-decoder architecture based on an improved point cloud encoder, a novel visual attention mechanism, graph convolutional decoders with skip connections, and a specialized mouth model that we smoothly integrate with the mesh convolutions. Compared to the previous state-of-the-art learning algorithms for non-rigid registration of face scans, SMF only requires the raw data to be rigidly aligned (with scaling) with a pre-defined face template. Additionally, our model provides topologically-sound meshes with minimal supervision, offers faster training time, has orders of magnitude fewer trainable parameters, is more robust to noise, and can generalize to previously unseen datasets. We extensively evaluate the quality of our registrations on diverse data. We demonstrate the robustness and generalizability of our model with in-the-wild face scans across different modalities, sensor types, and resolutions. Finally, we show that, by learning to register scans, SMF produces a hybrid linear and non-linear morphable model. Manipulation of the latent space of SMF allows for shape generation, and morphing applications such as expression transfer in-the-wild. We train SMF on a dataset of human faces comprising 9 large-scale databases on commodity hardware.
updated: Wed Mar 10 2021 15:25:41 GMT+0000 (UTC)
published: Wed Dec 16 2020 20:02:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト