arXiv reaDer
歴史的文書画像の二値化を強化するための変分拡張
Variational Augmentation for Enhancing Historical Document Image Binarization
歴史的文書の画像の 2 値化は、画像処理におけるよく知られたセグメンテーションの問題です。いたるところにあるにもかかわらず、従来のしきい値処理アルゴリズムは、著しく劣化した文書画像に対して限定的な成功しか収めていませんでした。ディープ ラーニングの出現により、いくつかのセグメンテーション モデルが提案され、この分野で大きな進歩を遂げましたが、大規模なトレーニング データセットが利用できないために制限されていました。この問題を軽減するために、新しい 2 段階のフレームワークを提案しました。最初のフレームワークは、変分推論を使用して劣化したサンプルを生成するジェネレーターで構成され、2 つ目は、生成されたデータをトレーニングする CNN ベースの 2 値化ネットワークです。さまざまなDIBCOデータセットでフレームワークを評価し、以前の最先端の方法に対して競争力のある結果を達成しました。
Historical Document Image Binarization is a well-known segmentation problem in image processing. Despite ubiquity, traditional thresholding algorithms achieved limited success on severely degraded document images. With the advent of deep learning, several segmentation models were proposed that made significant progress in the field but were limited by the unavailability of large training datasets. To mitigate this problem, we have proposed a novel two-stage framework -- the first of which comprises a generator that generates degraded samples using variational inference and the second being a CNN-based binarization network that trains on the generated data. We evaluated our framework on a range of DIBCO datasets, where it achieved competitive results against previous state-of-the-art methods.
updated: Sat Nov 12 2022 06:01:21 GMT+0000 (UTC)
published: Sat Nov 12 2022 06:01:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト