arXiv reaDer
完全畳み込みネットワークを使用して手書き文書画像に挑戦するためのテキスト行セグメンテーション
Text Line Segmentation for Challenging Handwritten Document Images Using Fully Convolutional Network
この論文は、挑戦的な歴史的原稿画像のテキスト行セグメンテーションのための方法を提示します。これらの原稿画像には、接触するコンポーネント、相互に浸透する母音記号、一貫性のないフォントの種類とサイズを含む狭い行間スペースが含まれています。さらに、複雑なページレイアウト内に、曲線、複数のスキュー、および複数の方向のサイドノートラインが含まれています。したがって、ポリゴンの境界ラベル付けは非常に難しく、時間がかかります。代わりに、同じテキスト行でコンポーネントを接続するラインマスクに依存しています。次に、これらのラインマスクは、完全畳み込みネットワーク(FCN)を使用して予測されます。文献では、FCNは通常の手書き文書画像のテキスト行セグメンテーションにうまく使用されています。本論文は、FCNが挑戦的な原稿画像にも有用であることを示しています。オーバーセグメンテーションとアンダーセグメンテーションに敏感な新しい評価メトリックを使用して、公開されている挑戦的な手書きデータセットでのテスト結果は、同じデータセットでの以前の作業の結果と比較できます。
This paper presents a method for text line segmentation of challenging historical manuscript images. These manuscript images contain narrow interline spaces with touching components, interpenetrating vowel signs and inconsistent font types and sizes. In addition, they contain curved, multi-skewed and multi-directed side note lines within a complex page layout. Therefore, bounding polygon labeling would be very difficult and time consuming. Instead we rely on line masks that connect the components on the same text line. Then these line masks are predicted using a Fully Convolutional Network (FCN). In the literature, FCN has been successfully used for text line segmentation of regular handwritten document images. The present paper shows that FCN is useful with challenging manuscript images as well. Using a new evaluation metric that is sensitive to over segmentation as well as under segmentation, testing results on a publicly available challenging handwritten dataset are comparable with the results of a previous work on the same dataset.
updated: Wed Jan 20 2021 19:51:26 GMT+0000 (UTC)
published: Wed Jan 20 2021 19:51:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト