arXiv reaDer
HairCLIP:テキストと参照画像で髪をデザインする
HairCLIP: Design Your Hair by Text and Reference Image
髪の編集は、コンピュータビジョンとグラフィックスにおいて興味深く挑戦的な問題です。多くの既存の方法では、編集の条件付き入力として適切に描画されたスケッチまたはマスクが必要ですが、これらの相互作用は単純でも効率的でもありません。面倒なインタラクションプロセスからユーザーを解放するために、この論文は、ユーザーによって提供されたテキストまたは参照画像に基づいて、ヘア属性を個別にまたは共同で操作できる新しいヘア編集インタラクションモードを提案します。この目的のために、共有埋め込みスペースで画像とテキストの状態をエンコードし、対照的な言語-画像事前トレーニング(CLIP)モデルの強力な画像テキスト表現機能を活用して統一された髪の編集フレームワークを提案します。慎重に設計されたネットワーク構造と損失関数により、私たちのフレームワークは、解きほぐされた方法で高品質のヘア編集を実行できます。広範な実験は、操作の正確さ、編集結果の視覚的なリアリズム、および無関係な属性の保存の点で、私たちのアプローチの優位性を示しています。プロジェクトリポジトリはhttps://github.com/wty-ustc/HairCLIPです。
Hair editing is an interesting and challenging problem in computer vision and graphics. Many existing methods require well-drawn sketches or masks as conditional inputs for editing, however these interactions are neither straightforward nor efficient. In order to free users from the tedious interaction process, this paper proposes a new hair editing interaction mode, which enables manipulating hair attributes individually or jointly based on the texts or reference images provided by users. For this purpose, we encode the image and text conditions in a shared embedding space and propose a unified hair editing framework by leveraging the powerful image text representation capability of the Contrastive Language-Image Pre-Training (CLIP) model. With the carefully designed network structures and loss functions, our framework can perform high-quality hair editing in a disentangled manner. Extensive experiments demonstrate the superiority of our approach in terms of manipulation accuracy, visual realism of editing results, and irrelevant attribute preservation. Project repo is https://github.com/wty-ustc/HairCLIP.
updated: Thu Dec 09 2021 18:59:58 GMT+0000 (UTC)
published: Thu Dec 09 2021 18:59:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト