最近、手書きの漢字の誤り訂正は、エンコーダ/デコーダ方式を採用して漢字を表意文字記述シーケンス (IDS) に分解することによって大幅に改善されました。しかし、既存の方法は、IDS シーケンスに固有の言語情報を暗黙的に取得してエンコードするため、見た文字と一致する IDS シーケンスを生成する傾向があります。これは、目に見えないスペルミスの文字を処理するときに問題を引き起こします。デコーダは、代わりに、目に見える文字と一致する IDS シーケンスを生成する可能性があるためです。したがって、目に見えないスペルミス文字に対してより適切な一般化を示す新しいアプローチであるカウント、デコード、フェッチ (CDF) を導入します。 CDF は主に、カウンター、デコーダー、フェッチャーの 3 つの部分で構成されます。最初の段階では、カウンターはシンボルレベルの位置の注釈なしで各部首クラスの数を予測します。第 2 段階では、デコーダはカウント情報を使用して、IDS シーケンスを段階的に生成します。さらに、各タイムステップでカウント情報を更新することにより、デコーダは各部首の存在を認識します。分解された IDS シーケンスを使用して、指定された文字のスペルが間違っているかどうかを判断できます。スペルが間違っている場合、変換転移学習戦略に基づくフェッチャーは、ユーザーが当初書くつもりだった理想的な文字を予測します。私たちの手法を既存のエンコーダ/デコーダ モデルに統合し、そのパフォーマンスを大幅に向上させます。
Recently, handwritten Chinese character error correction has been greatly improved by employing encoder-decoder methods to decompose a Chinese character into an ideographic description sequence (IDS). However, existing methods implicitly capture and encode linguistic information inherent in IDS sequences, leading to a tendency to generate IDS sequences that match seen characters. This poses a challenge when dealing with an unseen misspelled character, as the decoder may generate an IDS sequence that matches a seen character instead. Therefore, we introduce Count, Decode and Fetch (CDF), a novel approach that exhibits better generalization towards unseen misspelled characters. CDF is mainly composed of three parts: the counter, the decoder, and the fetcher. In the first stage, the counter predicts the number of each radical class without the symbol-level position annotations. In the second stage, the decoder employs the counting information and generates the IDS sequence step by step. Moreover, by updating the counting information at each time step, the decoder becomes aware of the existence of each radical. With the decomposed IDS sequence, we can determine whether the given character is misspelled. If it is misspelled, the fetcher under the transductive transfer learning strategy predicts the ideal character that the user originally intended to write. We integrate our method into existing encoder-decoder models and significantly enhance their performance.