arXiv reaDer
Pho(SC)Net: 歴史的文書におけるゼロショット単語画像認識に向けたアプローチ
Pho(SC)Net: An Approach Towards Zero-shot Word Image Recognition in Historical Documents
単語画像認識の目的で歴史的文書画像アーカイブの単語に注釈を付けるには、時間と熟練した人的資源 (歴史家、古文書学者など) が必要です。実際のシナリオでは、考えられるすべての単語のサンプル画像を取得することも現実的ではありません。ただし、ゼロショット学習方法を使用して、そのような歴史的文書画像内の目に見えない/辞書外の単語を認識することができます。単語のスポッティングと認識のためのこれまでの最先端の方法に基づいて、文字の形状の外観を考慮して 2 つの異なる単語を区別するハイブリッド表現を提案し、目に見えない単語をより効果的に認識することが示されています。この表現は Pyramidal Histogram of Shapes (PHOS) と呼ばれ、PHOC から派生したもので、単語内の文字の出現と位置に関する情報が埋め込まれています。その後、2 つの表現が組み合わされ、PHOS と PHOC の両方の特性を持つ埋め込みの有効性を調べるための実験が行われました。 「Phos」と結合された「Pho(SC)」表現の有効性を正当化する、2 つの公的に利用可能な歴史的文書データセットと 1 つの合成手書きデータセットについて、心強い結果が得られました。
Annotating words in a historical document image archive for word image recognition purpose demands time and skilled human resource (like historians, paleographers). In a real-life scenario, obtaining sample images for all possible words is also not feasible. However, Zero-shot learning methods could aptly be used to recognize unseen/out-of-lexicon words in such historical document images. Based on previous state-of-the-art methods for word spotting and recognition, we propose a hybrid representation that considers the character's shape appearance to differentiate between two different words and has shown to be more effective in recognizing unseen words. This representation has been termed as Pyramidal Histogram of Shapes (PHOS), derived from PHOC, which embeds information about the occurrence and position of characters in the word. Later, the two representations are combined and experiments were conducted to examine the effectiveness of an embedding that has properties of both PHOS and PHOC. Encouraging results were obtained on two publicly available historical document datasets and one synthetic handwritten dataset, which justifies the efficacy of "Phos" and the combined "Pho(SC)" representation.
updated: Mon May 31 2021 16:22:33 GMT+0000 (UTC)
published: Mon May 31 2021 16:22:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト