arXiv reaDer
オブジェクト検出ベースの手書きローカリゼーション
Object Detection Based Handwriting Localization
文書から手書き領域をローカライズするためのオブジェクト検出ベースのアプローチを提示します。これは、最初はデータ送信中の匿名化を強化することを目的としています。印刷されたテキストと手書きのメモまたは署名の両方を含む元の画像と前処理された画像の連結された融合が畳み込みニューラルネットワークに送られ、そこでバウンディングボックスが手書きを検出するように学習されます。その後、手書きの領域を処理して(たとえば、編集された署名に置き換える)、個人を特定できる情報(PII)を隠すことができます。ディープラーニングネットワークCascadeR-CNNに基づくこの処理パイプラインは、推論中にGPU上で10 fpsで動作します。これにより、最小限の計算オーバーヘッドで匿名化が強化されます。さらに、印象的な一般化可能性が経験的に示されています。英語が優勢なデータセットに基づくトレーニング済みモデルは、中国語でも架空の目に見えない請求書でうまく機能します。提案されたアプローチは、手書き認識や署名検証などの他のタスクを容易にすることも期待されています。
We present an object detection based approach to localize handwritten regions from documents, which initially aims to enhance the anonymization during the data transmission. The concatenated fusion of original and preprocessed images containing both printed texts and handwritten notes or signatures are fed into the convolutional neural network, where the bounding boxes are learned to detect the handwriting. Afterwards, the handwritten regions can be processed (e.g. replaced with redacted signatures) to conceal the personally identifiable information (PII). This processing pipeline based on the deep learning network Cascade R-CNN works at 10 fps on a GPU during the inference, which ensures the enhanced anonymization with minimal computational overheads. Furthermore, the impressive generalizability has been empirically showcased: the trained model based on the English-dominant dataset works well on the fictitious unseen invoices, even in Chinese. The proposed approach is also expected to facilitate other tasks such as handwriting recognition and signature verification.
updated: Mon Jun 28 2021 21:25:20 GMT+0000 (UTC)
published: Mon Jun 28 2021 21:25:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト