arXiv reaDer
任意の形状のテキスト検出のための双方向回帰
Bidirectional Regression for Arbitrary-Shaped Text Detection
最近、任意の形のテキスト検出がますます関心を集め、深層学習アルゴリズムの人気とともに急速な発展を目の当たりにしています。それにもかかわらず、既存のアプローチは、主にコンテキスト情報を利用する能力が比較的弱いこととオフセット参照の不適切な選択のために、不正確な検出結果を得ることがよくあります。このペーパーでは、前景と背景の両方の情報をパイプラインに統合し、オフセットの開始時にテキスト境界の近くのピクセルを自然に使用する、新しいテキストインスタンス式を紹介します。さらに、対応する後処理アルゴリズムも、4つの予測結果を順番に組み合わせて、テキストインスタンスを正確に再構築するように設計されています。湾曲したテキストデータセットと多方向のテキストデータセットの両方を含む、いくつかの挑戦的なシーンテキストベンチマークでメソッドを評価します。実験結果は、提案されたアプローチが他の最先端の方法と比較して優れたまたは競争力のあるパフォーマンスを得るということを示しています。たとえば、Total-Textの83.4%Fスコア、MSRA-TD500の82.4%Fスコアなどです。
Arbitrary-shaped text detection has recently attracted increasing interests and witnessed rapid development with the popularity of deep learning algorithms. Nevertheless, existing approaches often obtain inaccurate detection results, mainly due to the relatively weak ability to utilize context information and the inappropriate choice of offset references. This paper presents a novel text instance expression which integrates both foreground and background information into the pipeline, and naturally uses the pixels near text boundaries as the offset starts. Besides, a corresponding post-processing algorithm is also designed to sequentially combine the four prediction results and reconstruct the text instance accurately. We evaluate our method on several challenging scene text benchmarks, including both curved and multi-oriented text datasets. Experimental results demonstrate that the proposed approach obtains superior or competitive performance compared to other state-of-the-art methods, e.g., 83.4% F-score for Total-Text, 82.4% F-score for MSRA-TD500, etc.
updated: Tue Jul 13 2021 14:29:09 GMT+0000 (UTC)
published: Tue Jul 13 2021 14:29:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト