arXiv reaDer
近世印刷物の帰属に関する対照的注意ネットワーク
Contrastive Attention Networks for Attribution of Early Modern Print
この論文では、近世 (約 1500 ~ 1800 年) の英語の印刷本に含まれる未知の印刷本を識別するための機械学習技術を開発します。具体的には、匿名で印刷された書籍にある独特の損傷を受けた文字活字の刻印を、その起源の証拠を提供するために既知の印刷業者による作品と照合することに重点を置いています。これまで、この作業は分析書誌学者による手動調査に限定されていました。我々は、文字画像のペア全体で同様の損傷を識別するための対比的注意ベースのメトリック学習アプローチを提案します。このアプローチは、グリフ形状の非常に微妙な違いに敏感ですが、デジタル化された歴史書籍に関連するさまざまな交絡ノイズ源に対して堅牢です。教師付きデータの不足を克服するために、初期の印刷プロセスによって引き起こされる曲がり、破損、インクの変動をシミュレートすることを目的としたランダム データ合成手順を設計します。私たちの方法は、ドメイン内の人間の専門家によって検証されたように、この時代の印刷物の間で下流の損傷した活字と印影の一致を改善することに成功しました。近世の 2 つの重要な哲学書に対する私たちのアプローチの結果は、これらの本の起源と内容に関する既存の歴史的研究を拡張する可能性を示しています。
In this paper, we develop machine learning techniques to identify unknown printers in early modern (c.~1500--1800) English printed books. Specifically, we focus on matching uniquely damaged character type-imprints in anonymously printed books to works with known printers in order to provide evidence of their origins. Until now, this work has been limited to manual investigations by analytical bibliographers. We present a Contrastive Attention-based Metric Learning approach to identify similar damage across character image pairs, which is sensitive to very subtle differences in glyph shapes, yet robust to various confounding sources of noise associated with digitized historical books. To overcome the scarce amount of supervised data, we design a random data synthesis procedure that aims to simulate bends, fractures, and inking variations induced by the early printing process. Our method successfully improves downstream damaged type-imprint matching among printed works from this period, as validated by in-domain human experts. The results of our approach on two important philosophical works from the Early Modern period demonstrate potential to extend the extant historical research about the origins and content of these books.
updated: Mon Jun 12 2023 19:57:11 GMT+0000 (UTC)
published: Mon Jun 12 2023 19:57:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト