フォントの選択は、設計ワークフローで最も重要なステップの1つです。従来の方法は、かなりの分野の知識を必要とする順序付きリストに依存しており、訓練を受けた専門家でさえ使用するのが難しい場合があります。この論文では、フォント選択プロセスにセマンティクスをもたらし、専門知識のない人々がフォントを効果的に使用できるようにすることを目的とした、大規模なタグベースのフォント検索の問題に取り組んでいます。高品質のプロフェッショナルフォントの大規模なフォントタグ付けデータセットを収集します。このデータセットには、ほぼ20,000個のフォント、2,000個のタグ、および数十万個のフォントとタグの関係が含まれています。フォントのユニークな特性を活用する新しい生成的特徴学習アルゴリズムを提案します。重要な考え方は、フォント画像は合成であるため、学習アルゴリズムによって制御できるということです。統合されたレンダリングおよび学習プロセスを設計して、ある画像の視覚的特徴を使用して、異なるテキストで別の画像を再構築できるようにします。結果として得られる機能は、重要なフォントデザインの詳細をキャプチャすると同時に、テキストなどの迷惑な要素に対して堅牢です。ビジュアルテキストモデリングを統合するために、視覚的特徴を再重み付けするための新しい注意メカニズムを提案します。機能と注意メカニズムを新しい認識検索モデルに組み合わせます。実験結果は、私たちの方法が大規模なタグベースのフォント検索の重要な問題に対して最新技術を大幅に上回ることを示しています。
Font selection is one of the most important steps in a design workflow. Traditional methods rely on ordered lists which require significant domain knowledge and are often difficult to use even for trained professionals. In this paper, we address the problem of large-scale tag-based font retrieval which aims to bring semantics to the font selection process and enable people without expert knowledge to use fonts effectively. We collect a large-scale font tagging dataset of high-quality professional fonts. The dataset contains nearly 20,000 fonts, 2,000 tags, and hundreds of thousands of font-tag relations. We propose a novel generative feature learning algorithm that leverages the unique characteristics of fonts. The key idea is that font images are synthetic and can therefore be controlled by the learning algorithm. We design an integrated rendering and learning process so that the visual feature from one image can be used to reconstruct another image with different text. The resulting feature captures important font design details while is robust to nuisance factors such as text. We propose a novel attention mechanism to re-weight the visual feature for joint visual-text modeling. We combine the feature and the attention mechanism in a novel recognition-retrieval model. Experimental results show that our method significantly outperforms the state-of-the-art for the important problem of large-scale tag-based font retrieval.