arXiv reaDer
ドキュメントインテリジェンスのためのドメインにとらわれない少数のショット学習
Domain Agnostic Few-Shot Learning For Document Intelligence
数ショットの学習は、クラスラベル付きのサンプルが少ない新しいクラスに一般化することを目的としています。数ショット学習の研究では、転移学習、計量学習、メタ学習、ベイズ法から技術を借りてきました。これらの方法は、限られたトレーニングサンプルからモデルをトレーニングすることも目的としており、パフォーマンスは向上していますが、新しいドメインに一般化できないことがよくあります。既存のメタ学習方法の多くは、メタテストに使用される新しいクラスと同じドメインから基本クラスがサンプリングされるトレーニングデータに依存しています。ただし、ドキュメント分類などの業界の多くのアプリケーションでは、メタ学習のために大量のデータサンプルを収集することは実行不可能または不可能です。クロスドメインの数ショット学習の分野での研究は存在しますが、それは主にコンピュータービジョンに限定されています。私たちの知る限り、ビジネスワークフロー(フォーム、手紙、請求書など)の一部として生成された半構造化ドキュメント(紙のドキュメントのスキャン)の分類に数ショット学習を使用することを検討する作業はまだ存在しません。ここでは、ドメインシフトが重要であり、自然な画像から対象の半構造化ドキュメントに移行します。この作業では、ドメインシフトの下での数ショットのドキュメント画像分類の問題に対処します。私たちは、既存の方法との広範な比較によって私たちの仕事を評価します。実験結果は、提案された方法がドメインシフト下での数ショット分類性能の一貫した改善を示すことを示しています。
Few-shot learning aims to generalize to novel classes with only a few samples with class labels. Research in few-shot learning has borrowed techniques from transfer learning, metric learning, meta-learning, and Bayesian methods. These methods also aim to train models from limited training samples, and while encouraging performance has been achieved, they often fail to generalize to novel domains. Many of the existing meta-learning methods rely on training data for which the base classes are sampled from the same domain as the novel classes used for meta-testing. However, in many applications in the industry, such as document classification, collecting large samples of data for meta-learning is infeasible or impossible. While research in the field of the cross-domain few-shot learning exists, it is mostly limited to computer vision. To our knowledge, no work yet exists that examines the use of few-shot learning for classification of semi-structured documents (scans of paper documents) generated as part of a business workflow (forms, letters, bills, etc.). Here the domain shift is significant, going from natural images to the semi-structured documents of interest. In this work, we address the problem of few-shot document image classification under domain shift. We evaluate our work by extensive comparisons with existing methods. Experimental results demonstrate that the proposed method shows consistent improvements on the few-shot classification performance under domain shift.
updated: Fri Oct 29 2021 03:19:31 GMT+0000 (UTC)
published: Fri Oct 29 2021 03:19:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト