arXiv reaDer
粗いパターンを区別することによるテキスト行セグメンテーションの教師なし学習
Unsupervised learning of text line segmentationby differentiating coarse patterns
テキスト行セグメンテーションの教師あり深層学習の分野における最近の進歩にもかかわらず、教師なし深層学習ソリューションが人気を博し始めています。この論文では、距離が粗いテキストラインパターンの類似性に対応するコンパクトなユークリッド空間にドキュメント画像パッチを埋め込む教師なし深層学習法を提示します。このスペースが生成されると、テキスト行のセグメンテーションは、埋め込まれた特徴ベクトルを使用した標準的な手法を使用して簡単に実装できます。モデルをトレーニングするために、隣接するパッチに同様の粗い傾向のテキスト行が含まれていると仮定して、ドキュメント画像パッチのランダムなペアを抽出します。一方、それらの1つを回転させると、異なる粗い傾向のテキスト行が含まれます。このタスクをうまく行うには、モデルがテキスト行とその顕著な部分を認識することを学習する必要があります。私たちのアプローチの利点は、手動でのラベル付けの労力がゼロであることです。その有効性を実証するために、テキスト行セグメンテーションデータセットのいくつかのバリアントで定性的および定量的にメソッドを評価します。
Despite recent advances in the field of supervised deep learning for text line segmentation, unsupervised deep learning solutions are beginning to gain popularity. In this paper, we present an unsupervised deep learning method that embeds document image patches to a compact Euclidean space where distances correspond to a coarse text line pattern similarity. Once this space has been produced, text line segmentation can be easily implemented using standard techniques with the embedded feature vectors. To train the model, we extract random pairs of document image patches with the assumption that neighbour patches contain a similar coarse trend of text lines, whereas if one of them is rotated, they contain different coarse trends of text lines. Doing well on this task requires the model to learn to recognize the text lines and their salient parts. The benefit of our approach is zero manual labelling effort. We evaluate the method qualitatively and quantitatively on several variants of text line segmentation datasets to demonstrate its effectivity.
updated: Wed May 19 2021 21:21:30 GMT+0000 (UTC)
published: Wed May 19 2021 21:21:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト