arXiv reaDer
シーンテキスト認識における明示的および暗黙的タスクを介した相互特徴学習
Reciprocal Feature Learning via Explicit and Implicit Tasks in Scene Text Recognition
テキスト認識は、その幅広いアプリケーションで人気のあるトピックです。この作業では、追加の労力注釈コストなしで、従来のテキスト認識内で文字をカウントする暗黙のタスクを発掘します。暗黙のタスクは、順次認識を補完するための補助ブランチとして機能します。両方のタスクの特徴を適切に利用するために、2ブランチの相互特徴学習フレームワークを設計します。明示的なタスクと暗黙的なタスクの間の補完的な効果を活用することで、この機能は確実に強化されます。 7つのベンチマークでの広範な実験は、テキスト認識と新しく構築された文字カウントタスクの両方で提案された方法の利点を示しています。さらに、可変ネットワークとタスクを装備することは便利でありながら効果的です。豊富なアブレーション研究を提供し、タスクをより深く理解した実験を一般化します。コードが利用可能です。
Text recognition is a popular topic for its broad applications. In this work, we excavate the implicit task, character counting within the traditional text recognition, without additional labor annotation cost. The implicit task plays as an auxiliary branch for complementing the sequential recognition. We design a two-branch reciprocal feature learning framework in order to adequately utilize the features from both the tasks. Through exploiting the complementary effect between explicit and implicit tasks, the feature is reliably enhanced. Extensive experiments on 7 benchmarks show the advantages of the proposed methods in both text recognition and the new-built character counting tasks. In addition, it is convenient yet effective to equip with variable networks and tasks. We offer abundant ablation studies, generalizing experiments with deeper understanding on the tasks. Code is available.
updated: Mon Oct 25 2021 09:29:48 GMT+0000 (UTC)
published: Thu May 13 2021 12:27:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト