arXiv reaDer
テキストスポッティングのための意味的関連性に基づくリランカー
Semantic Relatedness Based Re-ranker for Text Spotting
  テキスト含意、盗作検出、ドキュメントクラスタリングなどのアプリケーションは、セマンティックな類似性の概念に依存しており、通常、LDAなどの次元削減手法または埋め込みベースのニューラルアプローチでアプローチされます。セマンティックの類似性だけでは不十分なシナリオを提示し、セマンティックの関連性を学習するためのニューラルアプローチを考案します。シナリオは、画像内のテキスト(道路標識、広告、バスの目的地など)を識別して認識する必要がある、野生でのテキストスポッティングです。私たちの目標は、セマンティック情報を活用して視覚システムのパフォーマンスを向上させることです。私たちの理論的根拠は、発見されるテキストはしばしばそれが現れる画像の文脈に関係しているということです(デルタ飛行機や四分の一駐車場のような単語のペアは似ていませんが、明らかに関連しています)。単語対単語または単語対文章の関連性スコアを学習することで、テキストスポッティングシステムのパフォーマンスを最大2.9ポイント改善し、ベンチマークデータセットの他の指標よりも優れていることを示します。
Applications such as textual entailment, plagiarism detection or document clustering rely on the notion of semantic similarity, and are usually approached with dimension reduction techniques like LDA or with embedding-based neural approaches. We present a scenario where semantic similarity is not enough, and we devise a neural approach to learn semantic relatedness. The scenario is text spotting in the wild, where a text in an image (e.g. street sign, advertisement or bus destination) must be identified and recognized. Our goal is to improve the performance of vision systems by leveraging semantic information. Our rationale is that the text to be spotted is often related to the image context in which it appears (word pairs such as Delta-airplane, or quarters-parking are not similar, but are clearly related). We show how learning a word-to-word or word-to-sentence relatedness score can improve the performance of text spotting systems up to 2.9 points, outperforming other measures in a benchmark dataset.
updated: Thu Sep 19 2019 15:29:27 GMT+0000 (UTC)
published: Tue Sep 17 2019 17:31:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト