arXiv reaDer
GVdoc: グラフベースのビジュアルドキュメント分類
GVdoc: Graph-based Visual Document Classification
実際の展開におけるモデルの堅牢性は、目に見えないデータに対してモデルがどの程度うまく機能するか、またドメイン内サンプルとドメイン外サンプルを区別できるかによって決まります。ビジュアル ドキュメント分類子は、配布中のテスト セットで優れたパフォーマンスを示しています。ただし、配布外の例を正しく分類して区別するのは難しい傾向があります。画像ベースの分類子にはテキスト コンポーネントがありませんが、マルチモダリティ トランスフォーマー ベースのモデルは、レイアウトが多様であるため、ビジュアル ドキュメントでのトークンのシリアル化の問題に直面します。また、推論中に多くの計算能力を必要とするため、現実世界の多くのアプリケーションでは非現実的になります。私たちは、これらの課題の両方に対処するグラフベースの文書分類モデル、GVdoc を提案します。私たちのアプローチでは、レイアウトに基づいてドキュメント グラフを生成し、グラフ ニューラル ネットワークをトレーニングしてノードとグラフの埋め込みを学習します。実験を通じて、私たちのモデルは、パラメータが少ない場合でも、分布外のデータでは最先端のモデルよりも優れたパフォーマンスを示し、同時に分布内のテストセットでは同等のパフォーマンスを維持できることを示しました。
The robustness of a model for real-world deployment is decided by how well it performs on unseen data and distinguishes between in-domain and out-of-domain samples. Visual document classifiers have shown impressive performance on in-distribution test sets. However, they tend to have a hard time correctly classifying and differentiating out-of-distribution examples. Image-based classifiers lack the text component, whereas multi-modality transformer-based models face the token serialization problem in visual documents due to their diverse layouts. They also require a lot of computing power during inference, making them impractical for many real-world applications. We propose, GVdoc, a graph-based document classification model that addresses both of these challenges. Our approach generates a document graph based on its layout, and then trains a graph neural network to learn node and graph embeddings. Through experiments, we show that our model, even with fewer parameters, outperforms state-of-the-art models on out-of-distribution data while retaining comparable performance on the in-distribution test set.
updated: Fri May 26 2023 19:23:20 GMT+0000 (UTC)
published: Fri May 26 2023 19:23:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト