arXiv reaDer
手書きページセグメンテーションのための教師なし深層学習
Unsupervised Deep Learning for Handwritten Page Segmentation
手書きのドキュメント画像を均一なパターンの領域にセグメント化することは、多くのドキュメント画像分析タスクにとって重要な前処理ステップです。レイアウト分析のための深層学習モデルをトレーニングするためにデータに手作業でラベルを付けるには、多大な人的努力が必要です。この論文では、注釈付き画像の必要性を取り消す、ページセグメンテーションのための教師なし深層学習法を提示します。シャムニューラルネットワークは、前景ピクセルの数、平均コンポーネントの高さと幅などの測定可能なプロパティを使用してパッチを区別するようにトレーニングされています。ネットワークは、空間的に近くのパッチが類似しているようにトレーニングされています。ネットワークで学習された特徴はページのセグメンテーションに使用され、パッチは抽出された特徴に基づいてメインテキストとサイドテキストに分類されます。非常に複雑なレイアウトの手書きドキュメント画像のデータセットでメソッドをテストしました。私たちの実験は、提案された教師なし方法が典型的な教師あり方法と同じくらい効果的であることを示しています。
Segmenting handwritten document images into regions with homogeneous patterns is an important pre-processing step for many document images analysis tasks. Hand-labeling data to train a deep learning model for layout analysis requires significant human effort. In this paper, we present an unsupervised deep learning method for page segmentation, which revokes the need for annotated images. A siamese neural network is trained to differentiate between patches using their measurable properties such as number of foreground pixels, and average component height and width. The network is trained that spatially nearby patches are similar. The network's learned features are used for page segmentation, where patches are classified as main and side text based on the extracted features. We tested the method on a dataset of handwritten document images with quite complex layouts. Our experiments show that the proposed unsupervised method is as effective as typical supervised methods.
updated: Tue Jan 19 2021 07:13:38 GMT+0000 (UTC)
published: Tue Jan 19 2021 07:13:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト