arXiv reaDer
カラーノイズと背景除去を伴うドキュメント画像の二値化のための2段階生成的敵対的ネットワーク
Two-Stage Generative Adversarial Networks for Document Image Binarization with Color Noise and Background Removal
ドキュメント画像の強調と2値化の方法は、テキスト認識などのドキュメント画像分析タスクの精度と効率を向上させるためによく使用されます。従来の非機械学習手法は、教師なしの方法で低レベルの機能に基づいて構築されていますが、背景が大幅に劣化したドキュメントでの2値化は困難です。畳み込みニューラルネットワークベースの方法は、グレースケール画像とローカルテキストの特徴にのみ焦点を当てています。本論文では、生成的敵対的ニューラルネットワークを用いた2段階カラードキュメント画像強調と二値化法を提案した。最初の段階では、4つの色に依存しない敵対的ネットワークがトレーニングされ、ドキュメント画像の強調のために入力画像から色の前景情報が抽出されます。第2段階では、グローバル機能とローカル機能を備えた2つの独立した敵対的ネットワークが、可変サイズのドキュメントの画像2値化のためにトレーニングされます。敵対的なニューラルネットワークの場合、エンコーダー-デコーダー構造を持つディスクリミネーターとジェネレーターの間の損失関数を定式化します。実験結果は、提案された方法が、ドキュメント画像二値化コンテスト(DIBCO)データセット、LRDEドキュメント二値化データセット(LRDE DBD)、および出荷ラベル画像データセットに対して、多くの古典的で最先端のアルゴリズムよりも優れたパフォーマンスを達成することを示しています。
Document image enhancement and binarization methods are often used to improve the accuracy and efficiency of document image analysis tasks such as text recognition. Traditional non-machine-learning methods are constructed on low-level features in an unsupervised manner but have difficulty with binarization on documents with severely degraded backgrounds. Convolutional neural network-based methods focus only on grayscale images and on local textual features. In this paper, we propose a two-stage color document image enhancement and binarization method using generative adversarial neural networks. In the first stage, four color-independent adversarial networks are trained to extract color foreground information from an input image for document image enhancement. In the second stage, two independent adversarial networks with global and local features are trained for image binarization of documents of variable size. For the adversarial neural networks, we formulate loss functions between a discriminator and generators having an encoder-decoder structure. Experimental results show that the proposed method achieves better performance than many classical and state-of-the-art algorithms over the Document Image Binarization Contest (DIBCO) datasets, the LRDE Document Binarization Dataset (LRDE DBD), and our shipping label image dataset.
updated: Mon Dec 14 2020 16:50:09 GMT+0000 (UTC)
published: Tue Oct 20 2020 07:51:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト