arXiv reaDer
深い顔の統合:新しい挑戦
Deep Facial Synthesis: A New Challenge
この論文の目的は、顔のスケッチ合成(FSS)の問題に関する包括的な研究を行うことです。ただし、手描きのスケッチデータセットを取得するにはコストがかかるため、過去10年間のFSSアルゴリズムの開発を評価するための完全なベンチマークがありません。そのため、最初にFSSの高品質データセットFS2Kを紹介します。これは、3種類のスケッチスタイル、画像の背景、照明条件、肌の色、顔の属性にまたがる2,104の画像とスケッチのペアで構成されます。 FS2Kは、難易度、多様性、スケーラビリティの点で以前のFSSデータセットとは異なり、したがってFSS研究の進展を促進するはずです。次に、24の手作りの特徴ベースの顔スケッチ合成アプローチ、37の一般的なニューラルスタイルの転送方法、43の深い画像から画像への変換方法、35の画像から画像への変換方法を含む、139の古典的な方法を調査することによって最大規模のFSS研究を提示します。スケッチアプローチ。さらに、既存の19の最先端モデルの包括的な実験を詳しく説明します。第3に、FSGANという名前のFSSの単純なベースラインを示します。 FSGANは、顔を意識したマスキングとスタイルベクトルの拡張という2つの単純なコンポーネントのみで、提案されたFS2Kデータセットの以前のすべての最先端モデルのパフォーマンスを大幅に上回っています。最後に、過去数年間に学んだ教訓で締めくくり、いくつかの未解決の課題を指摘します。オープンソースコードはhttps://github.com/DengPingFan/FSGANで入手できます。
The goal of this paper is to conduct a comprehensive study on the facial sketch synthesis (FSS) problem. However, due to the high costs in obtaining hand-drawn sketch datasets, there lacks a complete benchmark for assessing the development of FSS algorithms over the last decade. As such, we first introduce a high-quality dataset for FSS, named FS2K, which consists of 2,104 image-sketch pairs spanning three types of sketch styles, image backgrounds, lighting conditions, skin colors, and facial attributes. FS2K differs from previous FSS datasets in difficulty, diversity, and scalability, and should thus facilitate the progress of FSS research. Second, we present the largest-scale FSS study by investigating 139 classical methods, including 24 handcrafted feature based facial sketch synthesis approaches, 37 general neural-style transfer methods, 43 deep image-to-image translation methods, and 35 image-to-sketch approaches. Besides, we elaborate comprehensive experiments for existing 19 cutting-edge models. Third, we present a simple baseline for FSS, named FSGAN. With only two straightforward components, i.e., facial-aware masking and style-vector expansion, FSGAN surpasses the performance of all previous state-of-the-art models on the proposed FS2K dataset, by a large margin. Finally, we conclude with lessons learned over the past years, and point out several unsolved challenges. Our open-source code is available at https://github.com/DengPingFan/FSGAN.
updated: Fri Jan 07 2022 01:09:03 GMT+0000 (UTC)
published: Fri Dec 31 2021 13:19:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト