arXiv reaDer
Rosetta:画像のテキスト検出および認識のための大規模システム
Rosetta: Large scale system for text detection and recognition in images
  この記事では、Facebookの規模で毎日アップロードされる画像を処理するように設計された、展開されたスケーラブルな光学文字認識(OCR)システムを紹介します。画像コンテンツの共有は、FacebookやInstagramなどのソーシャルネットワーク内のインターネットユーザー間で情報をやり取りするための主要な方法の1つになりました。また、テキスト情報を含むそのようなメディアの理解は、検索および推奨アプリケーションを促進するために最も重要です。画像内のテキストを効率的に検出および認識するためのモデリング手法を紹介し、Rosettaのシステムアーキテクチャについて説明します。提示された技術の広範な評価を実行し、大規模なOCRシステムを構築するための有用な実用的アプローチを説明し、システムの開発および展開中に学んだ教訓に基づいて特定のコンポーネントがなぜおよびどのように機能するかについて洞察力に富んだ直感を提供します。
In this paper we present a deployed, scalable optical character recognition (OCR) system, which we call Rosetta, designed to process images uploaded daily at Facebook scale. Sharing of image content has become one of the primary ways to communicate information among internet users within social networks such as Facebook and Instagram, and the understanding of such media, including its textual information, is of paramount importance to facilitate search and recommendation applications. We present modeling techniques for efficient detection and recognition of text in images and describe Rosetta's system architecture. We perform extensive evaluation of presented technologies, explain useful practical approaches to build an OCR system at scale, and provide insightful intuitions as to why and how certain components work based on the lessons learnt during the development and deployment of the system.
updated: Fri Oct 11 2019 11:24:45 GMT+0000 (UTC)
published: Fri Oct 11 2019 11:24:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト