Dewarping Document Image By Displacement Flow Estimation with Fully Convolutional Network
カメラベースのドキュメントがますます使用されるにつれて、歪んだドキュメント画像の修正は、認識性能を改善するための必要性になります。この論文では、完全畳み込みネットワーク(FCN)を使用してピクセル単位の変位を推定することにより、歪んだドキュメント画像を修正し、背景を細かく除去するための新しいフレームワークを提案します。ドキュメント画像は、ピクセルの変位に応じた変換によって修正されます。 FCNは、合成された歪んだドキュメントの変位を回帰することによってトレーニングされ、変位の滑らかさを制御するために、正則化でローカルスムーズ制約(LSC)を提案します。私たちのアプローチは実装が簡単で、適度なコンピューティングリソースを消費します。実験により、私たちのアプローチは、さまざまな幾何学的歪みの下でドキュメント画像を効果的にデワープできることが証明され、局所的な詳細と全体的な効果の点で最先端のパフォーマンスを達成しました。
As camera-based documents are increasingly used, the rectification of distorted document images becomes a need to improve the recognition performance. In this paper, we propose a novel framework for both rectifying distorted document image and removing background finely, by estimating pixel-wise displacements using a fully convolutional network (FCN). The document image is rectified by transformation according to the displacements of pixels. The FCN is trained by regressing displacements of synthesized distorted documents, and to control the smoothness of displacements, we propose a Local Smooth Constraint (LSC) in regularization. Our approach is easy to implement and consumes moderate computing resource. Experiments proved that our approach can dewarp document images effectively under various geometric distortions, and has achieved the state-of-the-art performance in terms of local details and overall effect.
updated: Wed Apr 14 2021 12:32:36 GMT+0000 (UTC)
published: Wed Apr 14 2021 12:32:36 GMT+0000 (UTC)
