arXiv reaDer
DocTr:幾何学的なゆがみと照明補正のためのドキュメントイメージトランスフォーマー
DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction
この作業では、ドキュメントイメージのジオメトリと照明の歪みの問題に対処するために、ドキュメントイメージトランスフォーマー(DocTr)と呼ばれる新しいフレームワークを提案します。具体的には、DocTrは幾何学的な反りのないトランスと照明補正トランスで構成されています。学習したクエリ埋め込みのセットを設定することにより、幾何学的歪み補正トランスフォーマーは、自己注意メカニズムによってドキュメントイメージのグローバルコンテキストをキャプチャし、ピクセル単位の変位ソリューションをデコードして幾何学的歪みを修正します。幾何学的なゆがみを取り除いた後、照明補正トランスはシェーディングアーティファクトをさらに除去して、視覚的な品質とOCRの精度を向上させます。広範な評価がいくつかのデータセットで実施され、最先端の方法に対して優れた結果が報告されています。驚くべきことに、私たちのDocTrは20.02%の文字エラー率(CER)を達成し、最先端の方法に比べて15%の絶対的な改善を実現しています。さらに、実行時間とパラメーター数の効率も高くなっています。結果は、さらに比較するためにhttps://github.com/fh2019ustc/DocTrで入手できます。
In this work, we propose a new framework, called Document Image Transformer (DocTr), to address the issue of geometry and illumination distortion of the document images. Specifically, DocTr consists of a geometric unwarping transformer and an illumination correction transformer. By setting a set of learned query embedding, the geometric unwarping transformer captures the global context of the document image by self-attention mechanism and decodes the pixel-wise displacement solution to correct the geometric distortion. After geometric unwarping, our illumination correction transformer further removes the shading artifacts to improve the visual quality and OCR accuracy. Extensive evaluations are conducted on several datasets, and superior results are reported against the state-of-the-art methods. Remarkably, our DocTr achieves 20.02% Character Error Rate (CER), a 15% absolute improvement over the state-of-the-art methods. Moreover, it also shows high efficiency on running time and parameter count. The results will be available at https://github.com/fh2019ustc/DocTr for further comparison.
updated: Mon Oct 25 2021 13:27:10 GMT+0000 (UTC)
published: Mon Oct 25 2021 13:27:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト