arXiv reaDer
HTR モデルトレーニングの課題: プロジェクト Donner le gout de l'archive a l'ere numerique からのフィードバック
The Challenges of HTR Model Training: Feedback from the Project Donner le gout de l'archive a l'ere numerique
手書き認識技術の登場は、遺産研究の研究に新たな可能性をもたらします。しかし、研究チームによって開発された経験と実践を振り返る必要があります。 2018 年から Transkribus プラットフォームを使用することで、17 世紀のフランス語の手書き文字を転写するために作成された手書きテキスト認識 (HTR) モデルのパフォーマンスを改善する最も重要な方法を探すことになりました。したがって、この記事では、HTR モデルのパフォーマンスを向上させるために、言語モデルをフルスケールで使用し、基本モデルを使用する最良の方法を決定する、転写プロトコルの作成の影響について報告します。これらの要素をすべて組み合わせると、1 つのモデルのパフォーマンスを実際に 20% 以上向上させることができます (文字エラー率は 5% 未満に達します)。この記事では、Transkribus などの HTR プラットフォームの共同作業の性質に関するいくつかの課題と、手書きテキスト認識モデルの作成またはトレーニングの過程で生成されたデータを研究者が共有する方法についても説明します。
The arrival of handwriting recognition technologies offers new possibilities for research in heritage studies. However, it is now necessary to reflect on the experiences and the practices developed by research teams. Our use of the Transkribus platform since 2018 has led us to search for the most significant ways to improve the performance of our handwritten text recognition (HTR) models which are made to transcribe French handwriting dating from the 17th century. This article therefore reports on the impacts of creating transcribing protocols, using the language model at full scale and determining the best way to use base models in order to help increase the performance of HTR models. Combining all of these elements can indeed increase the performance of a single model by more than 20% (reaching a Character Error Rate below 5%). This article also discusses some challenges regarding the collaborative nature of HTR platforms such as Transkribus and the way researchers can share their data generated in the process of creating or training handwritten text recognition models.
updated: Thu Jun 22 2023 19:42:11 GMT+0000 (UTC)
published: Tue Dec 13 2022 12:42:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト