arXiv reaDer
TextSR:認識に導かれたコンテンツ認識テキスト超解像度
TextSR: Content-Aware Text Super-Resolution Guided by Recognition
  シーンテキスト認識は、畳み込みニューラルネットワークの進歩により急速に発展しました。それにもかかわらず、以前の方法のほとんどは、自然のシーン画像でよく見られる低解像度のテキストを認識するのにうまく機能しないかもしれません。直感的な解決策は、前処理として超解像技術を導入することです。しかし、文献の従来の超解像方法は、主に自然画像の詳細なテクスチャの再構成に焦点を当てており、通常、テキストの固有の特性によりテキストではうまく機能しません。これらの問題に取り組むために、この作業では、テキスト認識に必要な情報を生成するためのコンテンツ認識テキスト超解像度ネットワークを提案します。特に、超解像とテキスト認識を同時に実行できるエンドツーエンドネットワークを設計します。従来の超解像手法とは異なり、テキスト認識の損失をテキスト知覚損失として使用して、超解像ネットワークのトレーニングをガイドします。したがって、無関係な背景領域ではなく、テキストコンテンツにより多くの注意を払っています。いくつかの挑戦的なベンチマークでの広範な実験は、小さなぼやけた画像からシャープな高解像度画像を復元する提案手法の有効性を実証し、認識性能がテキスト認識機能の性能を明らかに高めることを示しています。私たちの知る限り、これはテキストの超解像度に焦点を当てた最初の作品です。コードはhttps://github.com/xieenze/TextSRでリリースされます。
Scene text recognition has witnessed rapid development with the advance of convolutional neural networks. Nonetheless, most of the previous methods may not work well in recognizing text with low resolution which is often seen in natural scene images. An intuitive solution is to introduce super-resolution techniques as pre-processing. However, conventional super-resolution methods in the literature mainly focus on reconstructing the detailed texture of natural images, which typically do not work well for text due to the unique characteristics of text. To tackle these problems, in this work, we propose a content-aware text super-resolution network to generate the information desired for text recognition. In particular, we design an end-to-end network that can perform super-resolution and text recognition simultaneously. Different from previous super-resolution methods, we use the loss of text recognition as the Text Perceptual Loss to guide the training of the super-resolution network, and thus it pays more attention to the text content, rather than the irrelevant background area. Extensive experiments on several challenging benchmarks demonstrate the effectiveness of our proposed method in restoring a sharp high-resolution image from a small blurred one, and show that the recognition performance clearly boosts up the performance of text recognizer. To our knowledge, this is the first work focusing on text super-resolution. Code will be released in https://github.com/xieenze/TextSR.
updated: Sun Oct 20 2019 03:30:58 GMT+0000 (UTC)
published: Mon Sep 16 2019 10:46:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト