arXiv reaDer
ポートレート画像の階層的ベクトル化
Hierarchical Vectorization for Portrait Images
直感的で使いやすいポートレート編集ツールの開発を目指して、ラスター画像を3層の階層表現に自動的に変換できる新しいベクトル化手法を提案します。ベースレイヤーは、顕著な幾何学的特徴と低周波色を特徴付ける一連のまばらな拡散曲線(DC)で構成され、セマンティックカラー転送と顔の表情の編集の手段を提供します。ミドルレベルは、鏡面ハイライトとシャドウを大きくて編集可能なポアソン領域(PR)にエンコードし、ユーザーがPRの強度を調整したり、形状を変更したりすることで、照明を直接調整できるようにします。トップレベルには、高周波残差とにきびや色素沈着などの細かいディテールのための2種類のピクセルサイズのPRが含まれています。また、高周波残差を自動的に生成できる深い生成モデルをトレーニングします。ベクトルプリミティブの意味のある編成のおかげで、ポートレートの編集は簡単で直感的になります。特に、私たちの方法は、色の転送、表情の編集、ハイライトとシャドウの編集、および自動レタッチをサポートしています。ラプラス演算子の線形性のおかげで、アルファブレンディング、線形覆い焼き、線形書き込みをベクトル編集に導入し、それらがハイライトとシャドウの編集に効果的であることを示します。結果を定量的に評価するために、照明を考慮して、一般的に使用されるFLIPメトリック(2つの画像間の差異を測定する)を拡張します。イルミネーションセンシティブFLIPまたはIS-FLIPと呼ばれる新しいメトリックは、カラー転送結果の顕著な変化を効果的にキャプチャでき、ポートレート画像のFLIPやその他の品質測定よりも人間の知覚と一致します。 FFHQRデータセットでこの方法を評価し、この方法が、レタッチ、ライト編集、色転写、表現編集などの一般的なポートレート編集タスクに効果的であることを示します。コードとトレーニング済みモデルを公開します。
Aiming at developing intuitive and easy-to-use portrait editing tools, we propose a novel vectorization method that can automatically convert raster images into a 3-tier hierarchical representation. The base layer consists of a set of sparse diffusion curves (DC) which characterize salient geometric features and low-frequency colors and provide means for semantic color transfer and facial expression editing. The middle level encodes specular highlights and shadows to large and editable Poisson regions (PR) and allows the user to directly adjust illumination via tuning the strength and/or changing shape of PR. The top level contains two types of pixel-sized PRs for high-frequency residuals and fine details such as pimples and pigmentation. We also train a deep generative model that can produce high-frequency residuals automatically. Thanks to the meaningful organization of vector primitives, editing portraits becomes easy and intuitive. In particular, our method supports color transfer, facial expression editing, highlight and shadow editing and automatic retouching. Thanks to the linearity of the Laplace operator, we introduce alpha blending, linear dodge and linear burn to vector editing and show that they are effective in editing highlights and shadows. To quantitatively evaluate the results, we extend the commonly used FLIP metric (which measures differences between two images) by considering illumination. The new metric, called illumination-sensitive FLIP or IS-FLIP, can effectively capture the salient changes in color transfer results, and is more consistent with human perception than FLIP and other quality measures on portrait images. We evaluate our method on the FFHQR dataset and show that our method is effective for common portrait editing tasks, such as retouching, light editing, color transfer and expression editing. We will make the code and trained models publicly available.
updated: Tue May 24 2022 07:58:41 GMT+0000 (UTC)
published: Tue May 24 2022 07:58:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト