ポスターの作成は、多くの場合時間がかかり、多くの手動編集と芸術的経験を必要とする、幅広いアプリケーションにとって重要なタスクです。この論文では、テキスト情報から視覚的に効果的なポスターを自動的に生成するために、Text2Poster と呼ばれる新しいデータ駆動型フレームワークを提案します。手動のポスター編集のプロセスを模倣して、私たちのフレームワークは、大規模な事前トレーニング済みのビジュアル-テキスト モデルを活用して、指定されたテキストから背景画像を取得し、カスケードされた自動エンコーダーによって反復的に画像上にテキストをレイアウトし、最後に、マッチングベースの方法。フレームワークのモジュールは、弱い教師と自己教師による学習戦略によって学習し、ラベル付きデータの需要を軽減します。客観的および主観的な実験の両方で、生成されたポスターの品質に関して、Text2Poster が学術研究や商用ソフトウェアを含む最先端の方法よりも優れていることが実証されています。
Poster generation is a significant task for a wide range of applications, which is often time-consuming and requires lots of manual editing and artistic experience. In this paper, we propose a novel data-driven framework, called Text2Poster, to automatically generate visually-effective posters from textual information. Imitating the process of manual poster editing, our framework leverages a large-scale pretrained visual-textual model to retrieve background images from given texts, lays out the texts on the images iteratively by cascaded auto-encoders, and finally, stylizes the texts by a matching-based method. We learn the modules of the framework by weakly- and self-supervised learning strategies, mitigating the demand for labeled data. Both objective and subjective experiments demonstrate that our Text2Poster outperforms state-of-the-art methods, including academic research and commercial software, on the quality of generated posters.