arXiv reaDer
テキストセグメンテーションの再考:新しいデータセットとテキスト固有の改良アプローチ
Rethinking Text Segmentation: A Novel Dataset and A Text-Specific Refinement Approach
テキストのセグメンテーションは、テキストスタイルの転送やシーンのテキストの削除など、実際のテキスト関連の多くのタスクの前提条件です。しかし、高品質のデータセットと専用の調査の欠如に直面して、この重要な前提条件は多くの研究で仮定として残されており、現在の研究ではほとんど見過ごされてきました。このギャップを埋めるために、TextSegを提案しました。これは、単語および文字ごとの境界ポリゴン、マスク、および文字起こしの6種類の注釈を備えた大規模な細かい注釈付きテキストデータセットです。また、テキストの固有のプロパティ(非凸境界、多様なテクスチャなど)に適応する新しいテキストセグメンテーションアプローチであるText Refinement Network(TexRNet)も紹介します。これは、従来のセグメンテーションモデルに負担をかけることがよくあります。 TexRNetでは、主要な機能のプーリングや注意に基づく類似性チェックなど、このような課題に対処するためのテキスト固有のネットワーク設計を提案しています。また、テキストセグメンテーションの大幅な改善を示すトライマップとディスクリミネーターの損失も紹介します。 TextSegデータセットと他の既存のデータセットの両方で広範な実験が行われます。 TexRNetは、他の最先端のセグメンテーション方法と比較して、テキストセグメンテーションのパフォーマンスを一貫して2%近く向上させることを示しています。データセットとコードはhttps://github.com/SHI-Labs/Rethinking-Text-Segmentationで入手できます。
Text segmentation is a prerequisite in many real-world text-related tasks, e.g., text style transfer, and scene text removal. However, facing the lack of high-quality datasets and dedicated investigations, this critical prerequisite has been left as an assumption in many works, and has been largely overlooked by current research. To bridge this gap, we proposed TextSeg, a large-scale fine-annotated text dataset with six types of annotations: word- and character-wise bounding polygons, masks and transcriptions. We also introduce Text Refinement Network (TexRNet), a novel text segmentation approach that adapts to the unique properties of text, e.g. non-convex boundary, diverse texture, etc., which often impose burdens on traditional segmentation models. In our TexRNet, we propose text specific network designs to address such challenges, including key features pooling and attention-based similarity checking. We also introduce trimap and discriminator losses that show significant improvement on text segmentation. Extensive experiments are carried out on both our TextSeg dataset and other existing datasets. We demonstrate that TexRNet consistently improves text segmentation performance by nearly 2% compared to other state-of-the-art segmentation methods. Our dataset and code will be made available at https://github.com/SHI-Labs/Rethinking-Text-Segmentation.
updated: Fri Nov 27 2020 22:50:09 GMT+0000 (UTC)
published: Fri Nov 27 2020 22:50:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト