arXiv reaDer
Augraphy: ドキュメント画像用のデータ拡張ライブラリ
Augraphy: A Data Augmentation Library for Document Images
このホワイト ペーパーでは、ドキュメント画像の現実的なデータ拡張戦略を対象とした Python パッケージである Augraphy を紹介します。 Augraphy は、さまざまな拡張戦略を使用して、古いまたは汚れたマシンによる印刷、スキャン、ファックス、時間の経過によるインクの劣化、手書きのマーキングなど、標準的なオフィス操作からゆがんでいるかのように見える、クリーンなドキュメント画像の拡張バージョンを生成します。 . Augraphy は、(1) ドキュメントのノイズ除去などのタスク用の多様なトレーニング データの生成、および (2) ドキュメント イメージ モデリング タスクのモデルの堅牢性を評価するための困難なテスト データの生成のためのデータ拡張ツールとして使用できます。このホワイト ペーパーでは、Augraphy の概要を説明し、Augraphy の堅牢性テストのユース ケースを 3 つ紹介します。
This paper introduces Augraphy, a Python package geared toward realistic data augmentation strategies for document images. Augraphy uses many different augmentation strategies to produce augmented versions of clean document images that appear as if they have been distorted from standard office operations, such as printing, scanning, and faxing through old or dirty machines, degradation of ink over time, and handwritten markings. Augraphy can be used both as a data augmentation tool for (1) producing diverse training data for tasks such as document de-noising, and (2) generating challenging test data for evaluating model robustness on document image modeling tasks. This paper provides an overview of Augraphy and presents three example robustness testing use-cases of Augraphy.
updated: Tue Aug 30 2022 22:36:19 GMT+0000 (UTC)
published: Tue Aug 30 2022 22:36:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト