arXiv reaDer
StrokeGAN:ストロークエンコーディングによる中国語フォント生成のモード崩壊の削減
StrokeGAN: Reducing Mode Collapse in Chinese Font Generation via Stroke Encoding
スタイリッシュな中国語フォントの生成は、多くのアプリケーションに関係する重要な問題です。既存の生成方法のほとんどは、深い生成モデル、特に生成的敵対的ネットワーク(GAN)ベースのモデルに基づいています。ただし、これらの深い生成モデルは、生成される結果の多様性と品質を大幅に低下させるモード崩壊の問題に悩まされる可能性があります。この論文では、漢字のキーモード情報をキャプチャし、それを中国語フォント生成の人気のある深層生成モデルであるCycleGANに組み込むための1ビットストロークエンコーディングを紹介します。その結果、主にストロークエンコーディングに漢字のモード情報が大量に含まれているという観察に動機付けられたStrokeGANと呼ばれる効率的な方法を提案します。関連する生成された文字の1ビットストロークエンコーディングを再構築するために、ディスクリミネータに課せられるストロークエンコーディング再構築損失を導入します。このような1ビットのストロークエンコーディングとストロークエンコーディングの再構築損失を備えているため、CycleGANのモード崩壊の問題は大幅に軽減され、ストロークの保存と生成される文字の多様性が向上します。 StrokeGANの有効性は、フォントが異なる9つのデータセットに対する一連の生成タスクによって示されます。数値結果は、StrokeGANが、コンテンツと認識の精度、および特定のストロークエラーの点で、一般に最先端の方法を上回り、よりリアルな文字を生成することを示しています。
The generation of stylish Chinese fonts is an important problem involved in many applications. Most of existing generation methods are based on the deep generative models, particularly, the generative adversarial networks (GAN) based models. However, these deep generative models may suffer from the mode collapse issue, which significantly degrades the diversity and quality of generated results. In this paper, we introduce a one-bit stroke encoding to capture the key mode information of Chinese characters and then incorporate it into CycleGAN, a popular deep generative model for Chinese font generation. As a result we propose an efficient method called StrokeGAN, mainly motivated by the observation that the stroke encoding contains amount of mode information of Chinese characters. In order to reconstruct the one-bit stroke encoding of the associated generated characters, we introduce a stroke-encoding reconstruction loss imposed on the discriminator. Equipped with such one-bit stroke encoding and stroke-encoding reconstruction loss, the mode collapse issue of CycleGAN can be significantly alleviated, with an improved preservation of strokes and diversity of generated characters. The effectiveness of StrokeGAN is demonstrated by a series of generation tasks over nine datasets with different fonts. The numerical results demonstrate that StrokeGAN generally outperforms the state-of-the-art methods in terms of content and recognition accuracies, as well as certain stroke error, and also generates more realistic characters.
updated: Wed Dec 16 2020 01:36:19 GMT+0000 (UTC)
published: Wed Dec 16 2020 01:36:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト