arXiv reaDer
デュアル潜在多様体によるスケーラブルなフォント再構成
Scalable Font Reconstruction with Dual Latent Manifolds
フォントスタイルと文字形状の両方の解きほぐされた多様体を学習することにより、タイポグラフィ分析とフォント再構成を実行する深い生成モデルを提案します。私たちのアプローチにより、以前の方法と比較して、効果的にモデル化できる文字タイプの数を大幅に増やすことができます。具体的には、すべてが文字タイプを共有するか、同じフォントに属するグリフの入力セットを受け取る推論ネットワークのペアを介して、文字とフォントを表す個別の潜在変数を推論します。この設計により、モデルをトレーニング時間中に観察されなかった文字に一般化することができます。これは、ほとんどのフォントの相対的な希薄性に照らして重要なタスクです。また、投影空間での適応分布を使用して尤度を測定する以前の作業から適応された新しい損失を提案し、弁別器を必要とせずに、より自然な画像を生成します。多くの言語の文字タイプを表すさまざまなデータセットのフォント再構築のタスクを評価し、自動および手動で評価されたメトリックの両方に従って、最新のスタイルの転送システムと比較して有利です。
We propose a deep generative model that performs typography analysis and font reconstruction by learning disentangled manifolds of both font style and character shape. Our approach enables us to massively scale up the number of character types we can effectively model compared to previous methods. Specifically, we infer separate latent variables representing character and font via a pair of inference networks which take as input sets of glyphs that either all share a character type, or belong to the same font. This design allows our model to generalize to characters that were not observed during training time, an important task in light of the relative sparsity of most fonts. We also put forward a new loss, adapted from prior work that measures likelihood using an adaptive distribution in a projected space, resulting in more natural images without requiring a discriminator. We evaluate on the task of font reconstruction over various datasets representing character types of many languages, and compare favorably to modern style transfer systems according to both automatic and manually-evaluated metrics.
updated: Fri Sep 10 2021 20:37:43 GMT+0000 (UTC)
published: Fri Sep 10 2021 20:37:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト