arXiv reaDer
期待値最大化アルゴリズムを使用した弱教師あり任意型テキスト検出
Weakly-Supervised Arbitrary-Shaped Text Detection with Expectation-Maximization Algorithm
任意の形のテキスト検出は、コンピュータビジョンにおける重要で挑戦的なタスクです。ほとんどの既存の方法では、教師ありトレーニング用のポリゴンレベルのテキスト領域ラベルを作成するために大量のデータラベル付けを行う必要があります。データラベリングのコストを削減するために、注釈がはるかに簡単なさまざまな弱い監視フォーム(画像レベルのタグ、粗い、緩い、狭い境界ボックスなど)を組み合わせるための、弱く監視された任意の形状のテキスト検出を研究します。期待値最大化(EM)ベースの弱教師あり学習フレームワークを提案し、少量のポリゴンレベルの注釈付きデータと大量の弱注釈付きデータを組み合わせて、正確な任意の形状のテキスト検出器をトレーニングします。一方、弱教師あり学習を組み込むのに適した輪郭ベースの任意の形状のテキスト検出器を提案します。 3つの任意の形状のテキストベンチマーク(CTW1500、Total-Text、およびICDAR-ArT)での広範な実験により、(1)10%の強い注釈付きデータと90%の弱い注釈付きデータのみを使用すると、この方法では現状と同等のパフォーマンスが得られることが示されています。 -アートメソッド、(2)100%強く注釈が付けられたデータを使用した場合、このメソッドは3つのベンチマークすべてで既存のメソッドよりも優れています。弱く注釈が付けられたデータセットは、将来公開される予定です。
Arbitrary-shaped text detection is an important and challenging task in computer vision. Most existing methods require heavy data labeling efforts to produce polygon-level text region labels for supervised training. In order to reduce the cost in data labeling, we study weakly-supervised arbitrary-shaped text detection for combining various weak supervision forms (e.g., image-level tags, coarse, loose and tight bounding boxes), which are far easier for annotation. We propose an Expectation-Maximization (EM) based weakly-supervised learning framework to train an accurate arbitrary-shaped text detector using only a small amount of polygon-level annotated data combined with a large amount of weakly annotated data. Meanwhile, we propose a contour-based arbitrary-shaped text detector, which is suitable for incorporating weakly-supervised learning. Extensive experiments on three arbitrary-shaped text benchmarks (CTW1500, Total-Text and ICDAR-ArT) show that (1) using only 10% strongly annotated data and 90% weakly annotated data, our method yields comparable performance to state-of-the-art methods, (2) with 100% strongly annotated data, our method outperforms existing methods on all three benchmarks. We will make the weakly annotated datasets publicly available in the future.
updated: Tue Dec 01 2020 11:45:39 GMT+0000 (UTC)
published: Tue Dec 01 2020 11:45:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト