arXiv reaDer
MRN: 増分多言語テキスト認識のための多重ルーティング ネットワーク
MRN: Multiplexed Routing Network for Incremental Multilingual Text Recognition
従来の多言語テキスト認識 (MLTR) は、通常、固定された言語セットを対象とするため、新しく追加された言語を処理したり、常に変化するクラス分布に適応したりするのに苦労します。このペーパーでは、新しい言語データがバッチで受信される、増分学習設定における増分多言語テキスト認識 (IMLTR) タスクを紹介します。一般的な増分学習と比較すると、IMLTR はリハーサルの不均衡 (リハーサル セット内のサンプル文字の不均一な分布) に悩まされるため、さらに困難です。この問題に対処するために、私たちは、一連の認識エンジンが言語ごとにトレーニングされる多重化ルーティング ネットワーク (MRN) を提案します。その後、言語予測子を採用して、投票のために認識子を比較検討します。認識機能は元のモデルから派生しているため、MRN は古いデータへの依存を効果的に減らし、リハーサルの不均衡に適しています。私たちは MLT17 および MLT19 データセットの MRN を広範囲に評価し、既存の最先端の方法を大幅に上回りました。つまり、さまざまな設定で 10.3% から 27.4% の範囲で精度が向上しました。
Traditional Multilingual Text Recognition (MLTR) usually targets a fixed set of languages and thus struggles to handle newly added languages or adapt to ever-changing class distributions. In this paper, we introduce the Incremental Multilingual Text Recognition (IMLTR) task in the incremental learning setting, where new language data comes in batches. Compared to generic incremental learning, IMLTR is even more challenging as it suffers from rehearsal-imbalance (uneven distribution of sample characters in the rehearsal set). To address this issue, we propose a Multiplexed Routing Network (MRN), where a series of recognizers is trained for each language. Subsequently, a language predictor is adopted to weigh the recognizers for voting. Since the recognizers are derived from the original model, MRN effectively reduces the reliance on older data and is better suited for rehearsal-imbalance. We extensively evaluate MRN on MLT17 and MLT19 datasets, outperforming existing state-of-the-art methods by a large margin, i.e., accuracy improvement ranging from 10.3% to 27.4% under different settings.
updated: Sat Jul 15 2023 16:25:37 GMT+0000 (UTC)
published: Wed May 24 2023 06:03:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト