arXiv reaDer
ディープインバースグラフィックスと学習した微分可能レンダラーを介した単一のサンプル画像からのリアルタイム仮想試着
Real-time Virtual-Try-On from a Single Example Image through Deep Inverse Graphics and Learned Differentiable Renderers
拡張現実アプリケーションはオンラインプラットフォーム全体に急速に広がり、消費者は化粧、染毛、靴などのさまざまな製品を事実上試着できるようになりました。ただし、特定の製品のリアルな画像を合成するためにレンダラーをパラメーター化することは、専門家の知識を必要とする困難な作業のままです。最近の研究では、サンプル画像から仮想試着のためのニューラルレンダリング方法が導入されていますが、現在のアプローチは、モバイルデバイスでリアルタイムに使用できない大規模な生成モデルに基づいています。これには、コンピュータグラフィックスとニューラルレンダリングアプローチの利点を組み合わせたハイブリッド方式が必要です。この論文では、深層学習に基づく新しいフレームワークを提案して、単一のサンプル画像を特定の拡張現実レンダリングエンジンのパラメータ空間にマッピングすることを学習するリアルタイム逆グラフィックスエンコーダを構築します。私たちの方法は、自己監視学習を活用し、ラベル付けされたトレーニングデータを必要としないため、多くの仮想試着アプリケーションに拡張できます。さらに、ほとんどの拡張現実レンダラーは、ポータブルデバイスでリアルタイムに到達するためのアルゴリズムの選択または実装上の制約のため、実際には区別できません。逆グラフィックス問題におけるグラフィックスベースの微分可能レンダラーの必要性を緩和するために、トレーニング可能な模倣モジュールを導入します。私たちの模倣者は、特定の微分不可能なレンダラーの動作を正確に再現することを学習する生成ネットワークです。ネットワークが各レンダリングパラメータの正確で連続的な表現を学習することを保証する、模倣者を訓練するための新しいレンダリング感度損失を提案します。私たちのフレームワークは、消費者がソーシャルメディア上の感動的な参照画像から新しい未知の製品を仮想的に試すことができる新しいアプリケーションを可能にします。また、グラフィックアーティストが参照製品画像からリアルなレンダリングを自動的に作成するために使用することもできます。
Augmented reality applications have rapidly spread across online platforms, allowing consumers to virtually try-on a variety of products, such as makeup, hair dying, or shoes. However, parametrizing a renderer to synthesize realistic images of a given product remains a challenging task that requires expert knowledge. While recent work has introduced neural rendering methods for virtual try-on from example images, current approaches are based on large generative models that cannot be used in real-time on mobile devices. This calls for a hybrid method that combines the advantages of computer graphics and neural rendering approaches. In this paper we propose a novel framework based on deep learning to build a real-time inverse graphics encoder that learns to map a single example image into the parameter space of a given augmented reality rendering engine. Our method leverages self-supervised learning and does not require labeled training data which makes it extendable to many virtual try-on applications. Furthermore, most augmented reality renderers are not differentiable in practice due to algorithmic choices or implementation constraints to reach real-time on portable devices. To relax the need for a graphics-based differentiable renderer in inverse graphics problems, we introduce a trainable imitator module. Our imitator is a generative network that learns to accurately reproduce the behavior of a given non-differentiable renderer. We propose a novel rendering sensitivity loss to train the imitator, which ensures that the network learns an accurate and continuous representation for each rendering parameter. Our framework enables novel applications where consumers can virtually try-on a novel unknown product from an inspirational reference image on social media. It can also be used by graphics artists to automatically create realistic rendering from a reference product image.
updated: Thu May 12 2022 18:44:00 GMT+0000 (UTC)
published: Thu May 12 2022 18:44:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト