arXiv reaDer
OCR制約付きGANを使用した合成手書き歴史文書の生成
Generating Synthetic Handwritten Historical Documents With OCR Constrained GANs
ラベルのない歴史的画像のコレクションだけを使用して、正確なグラウンドトゥルースを備えた合成歴史的文書を生成するためのフレームワークを提示します。大きなラベル付きデータセットを取得することは、ドキュメント画像分析(DIA)の教師あり深層学習手法を効果的に使用するための制限要因となることがよくあります。合成データ生成に向けた以前のアプローチでは、専門知識が必要であるか、合成ドキュメントの精度が低くなります。専門知識を必要とせずに高精度の変換を実現するために、2つのステップで問題に取り組みます。まず、ユーザー指定のコンテンツと構造を持つテンプレートドキュメントを作成します。次に、ラベルのない履歴画像のコレクションのスタイルを、テキストとレイアウトを維持しながらこれらのテンプレートドキュメントに転送します。事前トレーニング設定での合成履歴ドキュメントの使用を評価し、ベースライン(ランダムに初期化および事前トレーニング)を上回っていることを確認します。さらに、視覚的な例を使用して、正確なグラウンドトゥルースを使用して大きなラベル付きの歴史的文書データセットを生成できる高品質の合成を示します。
We present a framework to generate synthetic historical documents with precise ground truth using nothing more than a collection of unlabeled historical images. Obtaining large labeled datasets is often the limiting factor to effectively use supervised deep learning methods for Document Image Analysis (DIA). Prior approaches towards synthetic data generation either require expertise or result in poor accuracy in the synthetic documents. To achieve high precision transformations without requiring expertise, we tackle the problem in two steps. First, we create template documents with user-specified content and structure. Second, we transfer the style of a collection of unlabeled historical images to these template documents while preserving their text and layout. We evaluate the use of our synthetic historical documents in a pre-training setting and find that we outperform the baselines (randomly initialized and pre-trained). Additionally, with visual examples, we demonstrate a high-quality synthesis that makes it possible to generate large labeled historical document datasets with precise ground truth.
updated: Mon Mar 15 2021 09:39:17 GMT+0000 (UTC)
published: Mon Mar 15 2021 09:39:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト