arXiv reaDer
CCDWT-GAN: ドキュメント画像の二値化に離散ウェーブレット変換を使用したカラー チャネルに基づく敵対的生成ネットワーク
CCDWT-GAN: Generative Adversarial Networks Based on Color Channel Using Discrete Wavelet Transform for Document Image Binarization
色劣化した文書画像から文字情報を効率的に抽出することは重要な研究課題である。古文書の長期にわたる不完全な保存により、ページの汚れ、紙の黄ばみ、インクのにじみなど、さまざまな種類の劣化が生じます。これらの劣化は、情報抽出のための画像処理に悪影響を及ぼします。この論文では、RGB (赤、緑、青) チャネル分割画像に対して離散ウェーブレット変換 (DWT) を利用する敵対的生成ネットワーク (GAN) である CCDWT-GAN について紹介します。提案された方法は、画像前処理、画像強調、画像二値化の 3 つの段階で構成されます。この研究では、正規化を伴う DWT の最適な選択を決定するために、画像の前処理段階で比較実験を実施します。さらに、画像強調段階と画像二値化段階の結果に対してアブレーション スタディを実行し、モデルのパフォーマンスに対するプラスの効果を検証します。この研究では、DIBCO および H-DIBCO ((手書き) Document Image Binarization Competition) データセットで、提案された手法のパフォーマンスを他の最先端 (SOTA) 手法と比較します。実験結果は、CCDWT-GAN が複数のベンチマーク データセットで上位 2 つのパフォーマンスを達成し、他の SOTA 手法を上回るパフォーマンスを示していることを示しています。
To efficiently extract the textual information from color degraded document images is an important research topic. Long-term imperfect preservation of ancient documents has led to various types of degradation such as page staining, paper yellowing, and ink bleeding; these degradations badly impact the image processing for information extraction. In this paper, we present CCDWT-GAN, a generative adversarial network (GAN) that utilizes the discrete wavelet transform (DWT) on RGB (red, green, blue) channel splited images. The proposed method comprises three stages: image preprocessing, image enhancement, and image binarization. This work conducts comparative experiments in the image preprocessing stage to determine the optimal selection of DWT with normalization. Additionally, we perform an ablation study on the results of the image enhancement stage and the image binarization stage to validate their positive effect on the model performance. This work compares the performance of the proposed method with other state-of-the-art (SOTA) methods on DIBCO and H-DIBCO ((Handwritten) Document Image Binarization Competition) datasets. The experimental results demonstrate that CCDWT-GAN achieves a top two performance on multiple benchmark datasets, and outperforms other SOTA methods.
updated: Sat May 27 2023 08:55:56 GMT+0000 (UTC)
published: Sat May 27 2023 08:55:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト