arXiv reaDer
焦点を合わせる場所と場所:シーン画像内の任意の形状の近くのテキスト検出のためのシンプルでありながら正確なフレームワーク
Which and Where to Focus: A Simple yet Accurate Framework for Arbitrary-Shaped Nearby Text Detection in Scene Images
シーンテキストの検出は、研究者の注目を集めています。水平方向および方向付けされたテキストに対して多くの方法が提案されていますが、以前の方法は、湾曲したテキストなどの任意の形状のテキストを処理する場合にうまく機能しない可能性があります。特に、近くのテキストインスタンスの場合、混乱の問題が発生します。本論文では、正確な任意の形状の近くのシーンのテキスト検出のための単純で効果的な方法を提案した。まず、1対多のトレーニングスキーム(OMTS)は、混乱を排除し、提案が近くのテキストインスタンスの場合により適切な根拠を学習できるように設計されています。次に、提案機能アテンションモジュール(PFAM)を提案して、各提案に対してより効果的な機能を活用します。これにより、任意の形状のテキストインスタンスにより適切に適応できます。最後に、Faster R-CNNに基づいて、曲線表現を直接出力するベースラインを提案します。 PFAMとOMTSを搭載した検出器は、いくつかの困難なベンチマークで最先端または競争力のあるパフォーマンスを実現できます。
Scene text detection has drawn the close attention of researchers. Though many methods have been proposed for horizontal and oriented texts, previous methods may not perform well when dealing with arbitrary-shaped texts such as curved texts. In particular, confusion problem arises in the case of nearby text instances. In this paper, we propose a simple yet effective method for accurate arbitrary-shaped nearby scene text detection. Firstly, a One-to-Many Training Scheme (OMTS) is designed to eliminate confusion and enable the proposals to learn more appropriate groundtruths in the case of nearby text instances. Secondly, we propose a Proposal Feature Attention Module (PFAM) to exploit more effective features for each proposal, which can better adapt to arbitrary-shaped text instances. Finally, we propose a baseline that is based on Faster R-CNN and outputs the curve representation directly. Equipped with PFAM and OMTS, the detector can achieve state-of-the-art or competitive performance on several challenging benchmarks.
updated: Wed Sep 08 2021 06:25:37 GMT+0000 (UTC)
published: Wed Sep 08 2021 06:25:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト