arXiv reaDer
ディープラーニングベースのドキュメント画像強化に関する調査
A Survey on Deep learning based Document Image Enhancement
科学論文、納税申告書、請求書、契約書、歴史的文書などのデジタル化された文書は、今日広く使用されています。これらのドキュメント画像は、照明条件の悪さ、影、ノイズやブラーなどの歪み、経年変化、インクの染み、ブリードスルー、透かし、スタンプなど、さまざまな理由で劣化または損傷する可能性があります。ドキュメント画像の強調は、プレとして重要な役割を果たします。 -多くの自動化されたドキュメント分析および認識タスクの処理ステップ。特に、これらのタスクが劣化したドキュメントを処理している場合。ディープラーニングの最近の進歩に伴い、これらのドキュメント画像の品質を向上させるために多くの方法が提案されています。このホワイトペーパーでは、2値化、ブレ除去、ノイズ除去、フェージング、透かし除去、シャドウ除去など、6つの主要なドキュメント画像拡張タスクのディープラーニングベースの方法、データセット、およびメトリックを確認します。各タスクの最近の作業を要約し、それらの機能、課題、および制限について説明します。露出オーバーと露出アンダーの補正、超解像、ブリードスルー除去など、ほとんどまたはまったく注目されていない複数のドキュメント画像強調タスクを紹介します。私たちは、将来の研究のためのいくつかの有望な研究の方向性と機会を特定します。
Digitized documents such as scientific articles, tax forms, invoices, contract papers, historic texts are widely used nowadays. These document images could be degraded or damaged due to various reasons including poor lighting conditions, shadow, distortions like noise and blur, aging, ink stain, bleed-through, watermark, stamp, etc. Document image enhancement plays a crucial role as a pre-processing step in many automated document analysis and recognition tasks in particular when those tasks are dealing with degraded documents. With recent advances in deep learning, many methods are proposed to enhance the quality of these document images. In this paper, we review deep learning-based methods, datasets, and metrics for six main document image enhancement tasks, including binarization, debluring, denoising, defading, watermark removal, and shadow removal. We summarize the recent works for each task and discuss their features, challenges, and limitations. We introduce multiple document image enhancement tasks that have received little to no attention, including over and under exposure correction, super resolution, and bleed-through removal. We identify several promising research directions and opportunities for future research.
updated: Wed Dec 15 2021 03:16:31 GMT+0000 (UTC)
published: Mon Dec 06 2021 00:24:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト