arXiv reaDer
ポリゴンを超えたセルフテキスト:ボックス監視と動的セルフトレーニングによる制約のないテキスト検出
SelfText Beyond Polygon: Unconstrained Text Detection with Box Supervision and Dynamic Self-Training
ポリゴンは、テキスト検出用の直立した境界ボックスよりも正確な表現ですが、ポリゴンの注釈は非常に高価で困難です。ポリゴン注釈を使用した完全監視トレーニングを採用している既存の作品とは異なり、ポリゴンベースのテキスト検出器をトレーニングするバウンディングボックス監視(BBS)および動的セルフトレーニング(DST)を備えたSelfText Beyond Polygon(SBP)と呼ばれる新しいテキスト検出システムを提案します。直立したバウンディングボックスの注釈の限られたセットのみを使用します。 BBSの場合、最初に文字レベルの注釈付きの合成データを利用して、Skeleton Attention Segmentation Network(SASN)をトレーニングします。次に、ボックスレベルの注釈を採用して、高品質のポリゴンのような疑似ラベルの生成をガイドします。これは、任意の検出器のトレーニングに使用できます。このようにして、私たちの方法は、ポリゴン注釈でトレーニングされたテキスト検出器と同じパフォーマンスを実現します(つまり、両方ともICDAR2015のPSENetの85.0%Fスコアです)。 DSTの場合、誤警報を動的に削除することで、限られたラベル付きデータと大量のラベルなしデータを活用して、高価なベースラインをさらに上回ることができます。 SBPがテキスト検出の新しい視点を提供し、莫大なラベリングコストを節約できることを願っています。
Although a polygon is a more accurate representation than an upright bounding box for text detection, the annotations of polygons are extremely expensive and challenging. Unlike existing works that employ fully-supervised training with polygon annotations, we propose a novel text detection system termed SelfText Beyond Polygon (SBP) with Bounding Box Supervision (BBS) and Dynamic Self Training (DST), where training a polygon-based text detector with only a limited set of upright bounding box annotations. For BBS, we firstly utilize the synthetic data with character-level annotations to train a Skeleton Attention Segmentation Network (SASN). Then the box-level annotations are adopted to guide the generation of high-quality polygon-liked pseudo labels, which can be used to train any detectors. In this way, our method achieves the same performance as text detectors trained with polygon annotations (i.e., both are 85.0% F-score for PSENet on ICDAR2015 ). For DST, through dynamically removing the false alarms, it is able to leverage limited labeled data as well as massive unlabeled data to further outperform the expensive baseline. We hope SBP can provide a new perspective for text detection to save huge labeling costs.
updated: Thu Nov 26 2020 14:19:33 GMT+0000 (UTC)
published: Thu Nov 26 2020 14:19:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト