arXiv reaDer
フォントのマルチ陰的ニューラル表現
A Multi-Implicit Neural Representation for Fonts
フォントはドキュメント全体に遍在しており、さまざまなスタイルがあります。それらは、ネイティブのベクター形式で表されるか、固定解像度の画像を生成するためにラスタライズされます。最初のケースでは、非標準の表現は、ニューラル表現のための最新のネットワークアーキテクチャからの利益を妨げます。一方、後者の場合、ラスタライズされた表現は、ネットワークを介してエンコードされると、データの忠実度が失われます。これは、エッジやコーナーなどのフォント固有の不連続性をニューラルネットワークを使用して表現することが難しいためです。複雑なフォントは、より単純な占有関数のセットの重ね合わせによって表すことができるという観察に基づいて、機能(エッジやコーナーなど)を失うことなく、フォントを順列不変の学習された暗黙の関数のセットとして表すためのマルチ暗黙関数を導入します。 。ただし、マルチ暗黙的にフォント機能をローカルに保持する一方で、グラウンドトゥルースマルチチャネル信号の形式で監視を取得すること自体が問題になります。代わりに、ローカルの監視のみでそのような表現をトレーニングする方法を提案しますが、提案されたニューラルアーキテクチャは、フォントファミリのグローバルに一貫したマルチ暗黙を直接見つけます。再構成、補間、合成などのさまざまなタスクに対して提案された表現を広範囲に評価し、既存の代替案の明確な利点を示します。さらに、この表現により、グリフの完成が自然に可能になります。この場合、単一の特徴的なフォントを使用して、ターゲットスタイルでフォントファミリ全体を合成します。
Fonts are ubiquitous across documents and come in a variety of styles. They are either represented in a native vector format or rasterized to produce fixed resolution images. In the first case, the non-standard representation prevents benefiting from latest network architectures for neural representations; while, in the latter case, the rasterized representation, when encoded via networks, results in loss of data fidelity, as font-specific discontinuities like edges and corners are difficult to represent using neural networks. Based on the observation that complex fonts can be represented by a superposition of a set of simpler occupancy functions, we introduce multi-implicits to represent fonts as a permutation-invariant set of learned implict functions, without losing features (e.g., edges and corners). However, while multi-implicits locally preserve font features, obtaining supervision in the form of ground truth multi-channel signals is a problem in itself. Instead, we propose how to train such a representation with only local supervision, while the proposed neural architecture directly finds globally consistent multi-implicits for font families. We extensively evaluate the proposed representation for various tasks including reconstruction, interpolation, and synthesis to demonstrate clear advantages with existing alternatives. Additionally, the representation naturally enables glyph completion, wherein a single characteristic font is used to synthesize a whole font family in the target style.
updated: Sun Jan 09 2022 16:44:14 GMT+0000 (UTC)
published: Sat Jun 12 2021 21:40:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト