arXiv reaDer
表示するかしないか: 電子ディスプレイのビデオからの機密テキストの編集
To show or not to show: Redacting sensitive text from videos of electronic displays
ビデオ録画の普及に伴い、録画されたもののプライバシーを維持できるツールの必要性が高まっています。この論文では、光学式文字認識 (OCR) と自然言語処理 (NLP) 技術の組み合わせを使用して、ビデオから個人を特定できるテキストを編集するためのアプローチを定義します。さまざまな OCR モデル、特に Tesseract と Google Cloud Vision (GCV) の OCR システムで使用した場合のこのアプローチの相対的なパフォーマンスを調べます。提案されたアプローチでは、GCV のパフォーマンスは、精度と速度の両方で、Tesseract よりも大幅に高くなっています。最後に、実際のアプリケーションでの両方のモデルの長所と短所を調べます。
With the increasing prevalence of video recordings there is a growing need for tools that can maintain the privacy of those recorded. In this paper, we define an approach for redacting personally identifiable text from videos using a combination of optical character recognition (OCR) and natural language processing (NLP) techniques. We examine the relative performance of this approach when used with different OCR models, specifically Tesseract and the OCR system from Google Cloud Vision (GCV). For the proposed approach the performance of GCV, in both accuracy and speed, is significantly higher than Tesseract. Finally, we explore the advantages and disadvantages of both models in real-world applications.
updated: Fri Aug 19 2022 07:53:04 GMT+0000 (UTC)
published: Fri Aug 19 2022 07:53:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト