arXiv reaDer
CT-Net: 輪郭変換器による任意形状のテキスト検出
CT-Net: Arbitrary-Shaped Text Detection via Contour Transformer
輪郭ベースのシーンテキスト検出方法は最近急速に発展していますが、依然として不正確なフロントエンド輪郭初期化、多段階エラーの蓄積、または不十分なローカル情報集約の問題に悩まされています。これらの制限に対処するために、我々は、輪郭変換器を使用した漸進的輪郭回帰による、CT-Net と呼ばれる新しい任意形状のシーンテキスト検出フレームワークを提案します。具体的には、まず、後処理を行わずに粗いテキスト輪郭を生成する輪郭初期化モジュールを採用します。次に、輪郭洗練モジュールを採用して、テキストの輪郭を反復的に適応的に洗練します。これは、コンテキスト情報の取得と漸進的なグローバル輪郭変形に有益です。さらに、輪郭変換器がより多くの潜在的な変形パスを学習できるようにする適応トレーニング戦略を提案し、誤検知を効果的に抑制できる再スコアリングメカニズムを導入します。 4 つの困難なデータセットに対して広範な実験が行われ、最先端の手法に対する CT-Net の精度と効率性が実証されました。特に、CT-Net は、CTW1500 データセットと Total-Text データセットで、それぞれ 11.2 フレーム/秒 (FPS) で F 値 86.1、10.1 FPS で F 値 87.8 を達成します。
Contour based scene text detection methods have rapidly developed recently, but still suffer from inaccurate frontend contour initialization, multi-stage error accumulation, or deficient local information aggregation. To tackle these limitations, we propose a novel arbitrary-shaped scene text detection framework named CT-Net by progressive contour regression with contour transformers. Specifically, we first employ a contour initialization module that generates coarse text contours without any post-processing. Then, we adopt contour refinement modules to adaptively refine text contours in an iterative manner, which are beneficial for context information capturing and progressive global contour deformation. Besides, we propose an adaptive training strategy to enable the contour transformers to learn more potential deformation paths, and introduce a re-score mechanism that can effectively suppress false positives. Extensive experiments are conducted on four challenging datasets, which demonstrate the accuracy and efficiency of our CT-Net over state-of-the-art methods. Particularly, CT-Net achieves F-measure of 86.1 at 11.2 frames per second (FPS) and F-measure of 87.8 at 10.1 FPS for CTW1500 and Total-Text datasets, respectively.
updated: Tue Jul 25 2023 08:00:40 GMT+0000 (UTC)
published: Tue Jul 25 2023 08:00:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト