arXiv reaDer
ドキュメントレイアウト生成のためのグラフベースの深層生成モデリング
Graph-based Deep Generative Modelling for Document Layout Generation
ディープラーニングアプローチの主要な前提条件の1つは、大規模なトレーニングデータの可用性です。実際のシナリオでスキャンされたドキュメント画像を処理する場合、そのコンテンツの主要な情報はレイアウト自体に保存されます。この作業では、グラフニューラルネットワーク(GNN)を使用して自動化された深層生成モデルを提案し、ドキュメント解釈システム、この場合は特にデジタルメールルームアプリケーションのトレーニングに使用できる、非常に可変で妥当なドキュメントレイアウトの合成データを生成します。これは、管理ドキュメントイメージ(この場合は請求書)で実験されたドキュメントレイアウト生成タスクの最初のグラフベースのアプローチでもあります。
One of the major prerequisites for any deep learning approach is the availability of large-scale training data. When dealing with scanned document images in real world scenarios, the principal information of its content is stored in the layout itself. In this work, we have proposed an automated deep generative model using Graph Neural Networks (GNNs) to generate synthetic data with highly variable and plausible document layouts that can be used to train document interpretation systems, in this case, specially in digital mailroom applications. It is also the first graph-based approach for document layout generation task experimented on administrative document images, in this case, invoices.
updated: Fri Jul 09 2021 10:49:49 GMT+0000 (UTC)
published: Fri Jul 09 2021 10:49:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト