arXiv reaDer
HORAE:時間の本の注釈付きデータセット
HORAE: an annotated dataset of books of hours
この論文では、中世後期の裕福な一般の人々が所有し使用している手書きの祈祷書の一種である、時間の本からの注釈付きページの新しいデータセットを紹介します。データセットは、時祷書が豊富なイラストとさまざまな種類の宗教情報源の両方のおかげで主要な情報源の1つであるため、この時期のヨーロッパの宗教的考え方の進化に関する歴史的研究を行うために作成されました。最初に、コーパスがどのように収集され、手動で注釈が付けられたかについて説明し、次に、テキスト行の検出とゾーンの検出および入力のための最先端のシステムの評価を示します。コーパスは自由に研究に利用できます。
We introduce in this paper a new dataset of annotated pages from books of hours, a type of handwritten prayer books owned and used by rich lay people in the late middle ages. The dataset was created for conducting historical research on the evolution of the religious mindset in Europe at this period since the book of hours represent one of the major sources of information thanks both to their rich illustrations and the different types of religious sources they contain. We first describe how the corpus was collected and manually annotated then present the evaluation of a state-of-the-art system for text line detection and for zone detection and typing. The corpus is freely available for research.
updated: Tue Dec 01 2020 09:25:38 GMT+0000 (UTC)
published: Tue Dec 01 2020 09:25:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト