arXiv reaDer
グラフ表現学習を備えた意味論的駆動の生成的敵対的ネットワークによる二相顔写真スケッチ合成
Biphasic Face Photo-Sketch Synthesis via Semantic-Driven Generative Adversarial Network with Graph Representation Learning
近年、Generative Adversarial Network(GAN)の開発により、二相性の顔写真スケッチ合成において大きな進歩が達成されました。二相性の顔写真スケッチ合成は、デジタルエンターテインメントや法執行機関などの幅広い分野に適用できます。ただし、リアルな写真や明確なスケッチを生成するには、スケッチの品質が低く、実際のシーンでの写真のバリエーションが複雑であるため、大きな課題があります。この目的のために、グラフ表現学習と協力して、上記の問題に対処するための新しいセマンティック駆動型の生成的敵対的ネットワークを提案します。具体的には、クラスごとのセマンティックレイアウトをジェネレーターに挿入して、合成された顔写真やスケッチにスタイルベースの空間監視を提供します。さらに、生成された結果の忠実度を向上させるために、セマンティックレイアウトを活用して、合成された画像のクラス内セマンティック機能とクラス間構造機能を示す2種類の表現グラフを作成します。さらに、提案された表現グラフに基づいて2種類の制約を設計し、生成された顔写真やスケッチの詳細の保存を容易にします。さらに、合成画像の知覚品質をさらに向上させるために、反復サイクルトレーニングを通じて生成された結果を洗練することに専念する新しい二相トレーニング戦略を提案します。 CUFSおよびCUFSFデータセットで広範な実験が行われ、最先端のパフォーマンスを実現する提案された方法の卓越した能力が実証されています。
In recent years, significant progress has been achieved in biphasic face photo-sketch synthesis with the development of Generative Adversarial Network (GAN). Biphasic face photo-sketch synthesis could be applied in wide-ranging fields such as digital entertainment and law enforcement. However, generating realistic photos and distinct sketches suffers from great challenges due to the low quality of sketches and complex photo variations in the real scenes. To this end, we propose a novel Semantic-Driven Generative Adversarial Network to address the above issues, cooperating with the Graph Representation Learning. Specifically, we inject class-wise semantic layouts into the generator to provide style-based spatial supervision for synthesized face photos and sketches. In addition, to improve the fidelity of the generated results, we leverage the semantic layouts to construct two types of Representational Graphs which indicate the intra-class semantic features and inter-class structural features of the synthesized images. Furthermore, we design two types of constraints based on the proposed Representational Graphs which facilitate the preservation of the details in generated face photos and sketches. Moreover, to further enhance the perceptual quality of synthesized images, we propose a novel biphasic training strategy which is dedicated to refine the generated results through Iterative Cycle Training. Extensive experiments are conducted on CUFS and CUFSF datasets to demonstrate the prominent ability of our proposed method which achieves the state-of-the-art performance.
updated: Wed Jan 05 2022 13:14:14 GMT+0000 (UTC)
published: Wed Jan 05 2022 13:14:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト