arXiv reaDer
PERT:シーンテキストを削除するための段階的なリージョンベースのネットワーク
PERT: A Progressively Region-based Network for Scene Text Removal
シーンテキスト削除(STR)には、テキストのローカリゼーションと背景の再構築の2つのプロセスが含まれます。以前の方法では、両方のプロセスを1つのネットワークに統合することで、画像全体のすべてのピクセルを変更することにより、暗黙的な消去ガイダンスを提供します。ただし、2つの問題があります。1)暗黙の消去ガイダンスにより、テキスト以外の領域が過度に消去されます。 2)1段階の消去では、テキスト領域を完全に削除できません。この論文では、ProgrEssively Regionベースのシーンテキスト消しゴム(PERT)を提案し、明示的な消去ガイダンスを導入し、正確で徹底的なテキスト除去のためにバランスの取れた多段階消去を実行します。まず、消去プロセスを明示的にガイドするために、新しいリージョンベースの変更戦略(RegionMS)を導入します。以前の暗黙的にガイドされた方法とは異なり、RegionMSはテキスト領域のみでターゲットおよび地域の消去を実行し、ストロークレベルの情報を適応的に認識して、境界ボックスレベルの注釈のみで非テキスト領域の整合性を向上させます。次に、PERTは、いくつかの段階的な消去段階でバランスの取れた多段階消去を実行します。各消去段階は、テキスト領域の完全な消去を確実にするために、テキスト消去された画像に向かって等しいステップを踏みます。以前の方法と比較して、PERTは、敵対的な損失を必要とせずに大幅に優れており、高速(71 FPS)でパラメーターの複雑さが少なくとも25%低いSOTA結果を取得します。コードはhttps://github.com/wangyuxin87/PERTで入手できます。
Scene text removal (STR) contains two processes: text localization and background reconstruction. Through integrating both processes into a single network, previous methods provide an implicit erasure guidance by modifying all pixels in the entire image. However, there exists two problems: 1) the implicit erasure guidance causes the excessive erasure to non-text areas; 2) the one-stage erasure lacks the exhaustive removal of text region. In this paper, we propose a ProgrEssively Region-based scene Text eraser (PERT), introducing an explicit erasure guidance and performing balanced multi-stage erasure for accurate and exhaustive text removal. Firstly, we introduce a new region-based modification strategy (RegionMS) to explicitly guide the erasure process. Different from previous implicitly guided methods, RegionMS performs targeted and regional erasure on only text region, and adaptively perceives stroke-level information to improve the integrity of non-text areas with only bounding box level annotations. Secondly, PERT performs balanced multi-stage erasure with several progressive erasing stages. Each erasing stage takes an equal step toward the text-erased image to ensure the exhaustive erasure of text regions. Compared with previous methods, PERT outperforms them by a large margin without the need of adversarial loss, obtaining SOTA results with high speed (71 FPS) and at least 25% lower parameter complexity. Code is available at https://github.com/wangyuxin87/PERT.
updated: Sun Sep 12 2021 07:09:17 GMT+0000 (UTC)
published: Thu Jun 24 2021 14:06:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト