arXiv reaDer
自然言語処理を使用した後処理を通じて光学式文字認識を改善するための新しいパイプライン
A Novel Pipeline for Improving Optical Character Recognition through Post-processing Using Natural Language Processing
光学式文字認識 (OCR) テクノロジーは、書籍や非構造化文書のデジタル化に応用できるほか、移動統計、法執行機関、交通、セキュリティ システムなどの他の分野にも応用できます。最先端の手法は、ナンバープレートや店名などに印刷されたテキストを OCR します。ただし、印刷された教科書や手書きのテキストなどのアプリケーションは、既存の技術では精度が限られています。その理由としては、文字の見た目が似ていることや手書き文字のバリエーションなどが考えられます。これらの問題に OCR テクノロジーだけで対処するのは難しいため、自然言語処理 (NLP) ツールを使用した後処理アプローチを提案します。この研究では、最初に手書きまたは印刷されたテキストに対して OCR を実行し、次に NLP を使用して精度を向上させるエンドツーエンドのパイプラインを示しています。
Optical Character Recognition (OCR) technology finds applications in digitizing books and unstructured documents, along with applications in other domains such as mobility statistics, law enforcement, traffic, security systems, etc. The state-of-the-art methods work well with the OCR with printed text on license plates, shop names, etc. However, applications such as printed textbooks and handwritten texts have limited accuracy with existing techniques. The reason may be attributed to similar-looking characters and variations in handwritten characters. Since these issues are challenging to address with OCR technologies exclusively, we propose a post-processing approach using Natural Language Processing (NLP) tools. This work presents an end-to-end pipeline that first performs OCR on the handwritten or printed text and then improves its accuracy using NLP.
updated: Sun Jul 09 2023 18:51:17 GMT+0000 (UTC)
published: Sun Jul 09 2023 18:51:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト