arXiv reaDer
適合または不適合:弱い監視からのモデルベースの顔の再構成とオクルージョンのセグメンテーション
To fit or not to fit: Model-based Face Reconstruction and Occlusion Segmentation from Weak Supervision
閉塞下での3D顔の再構築は、閉塞者のばらつきが大きいため、非常に困難です。現在、最も成功している方法は、逆レンダリングによって3D顔モデルに適合し、オクルーダーの適合を回避するためにオクルーダーの特定のセグメンテーションを想定しています。ただし、オクルージョンセグメンテーションモデルのトレーニングには、大量の注釈付きデータが必要です。この作業では、オクルージョンに対して非常に堅牢であるが、トレーニングにオクルージョン注釈を必要としない3D顔再構成のモデルベースのアプローチを紹介します。私たちのアプローチでは、生成的顔モデルは人間の顔のみを合成でき、オクルーダーは合成できないという事実を利用します。このプロパティを使用して、オクルージョンセグメンテーションネットワークの意思決定プロセスをガイドし、教師なしトレーニングを行います。主な課題は、モデルのフィッティングとオクルージョンのセグメンテーションが相互に依存しており、一緒に推測する必要があることです。この鶏が先か卵が先かという問題は、EMタイプのトレーニング戦略で解決します。これは相乗効果につながり、セグメンテーションネットワークが顔エンコーダーがオクルージョンにフィットするのを防ぎ、再構成の品質を向上させます。改善された3D顔再構成により、セグメンテーションネットワークはオクルージョンをより正確に予測できます。 CelebA-HQ、ARデータベース、およびNoWチャレンジに関する定性的および定量的実験は、提案されたパイプラインが閉塞下で最先端の3D顔再構成を実現することを示しています。さらに、セグメンテーションネットワークは、オクルージョンアノテーションなしでトレーニングされているにもかかわらず、オクルージョンを正確にローカライズします。コードはhttps://github.com/unibas-gravis/Occlusion-Robust-MoFAで入手できます。
3D face reconstruction under occlusions is highly challenging due to the large variability of occluders. Currently, the most successful methods fit a 3D face model through inverse rendering and assume a given segmentation of the occluder to avoid fitting the occluder. However, training an occlusion segmentation model requires large amounts of annotated data. In this work, we introduce a model-based approach for 3D face reconstruction that is highly robust to occlusions but does not require any occlusion annotations for training. In our approach, we exploit the fact that generative face models can only synthesize human faces, but not the occluders. We use this property to guide the decision-making process of an occlusion segmentation network and resulting in unsupervised training. The main challenge is that the model fitting and the occlusion segmentation are mutually dependent on each other, and need to be inferred jointly. We resolve this chicken-and-egg problem with an EM-type training strategy. This leads to a synergistic effect, in which the segmentation network prevents the face encoder from fitting to the occlusion, enhancing the reconstruction quality. The improved 3D face reconstruction, in turn, enables the segmentation network to better predict the occlusion. Qualitative and quantitative experiments on the CelebA-HQ, the AR databases, and the NoW challenge demonstrate that the proposed pipeline achieves the state-of-the-art 3D face reconstruction under occlusion. Moreover, the segmentation network localizes occlusions accurately despite being trained without any occlusion annotation. The code is available at https://github.com/unibas-gravis/Occlusion-Robust-MoFA.
updated: Fri Mar 11 2022 00:18:43 GMT+0000 (UTC)
published: Thu Jun 17 2021 15:52:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト