arXiv reaDer
MIDV-2019:最新のモバイルベースのドキュメントOCRの課題
MIDV-2019: Challenges of the modern mobile-based document OCR
  モバイルデバイスを使用したIDドキュメントの認識は、広範なコンピュータービジョン研究のトピックになっています。顔の検出、文書の検出と修正、テキストフィールドの認識などのタスクを解決するための方法とアルゴリズムのポートフォリオが拡大しており、データセットの不足が重要な問題になっています。そのような方法を評価するためのオープンにアクセス可能なデータセットの1つは、さまざまな条件で50のIDドキュメントタイプのビデオクリップを含むMIDV-500です。ただし、MIDV-500での条件のキャプチャの変動性は、主に重要な投影歪みと異なる照明条件のいくつかの重要な問題に対処しませんでした。このホワイトペーパーでは、最新の高解像度モバイルカメラで撮影されたビデオクリップを含むMIDV-2019データセットを提示します。これには、強い投影歪みと低い照明条件があります。追加されたデータの説明と、さまざまな条件でのテキストフィールド認識の実験ベースラインが表示されます。データセットは、ftp://smartengines.com/midv-500/extra/midv-2019/からダウンロードできます。
Recognition of identity documents using mobile devices has become a topic of a wide range of computer vision research. The portfolio of methods and algorithms for solving such tasks as face detection, document detection and rectification, text field recognition, and other, is growing, and the scarcity of datasets has become an important issue. One of the openly accessible datasets for evaluating such methods is MIDV-500, containing video clips of 50 identity document types in various conditions. However, the variability of capturing conditions in MIDV-500 did not address some of the key issues, mainly significant projective distortions and different lighting conditions. In this paper we present a MIDV-2019 dataset, containing video clips shot with modern high-resolution mobile cameras, with strong projective distortions and with low lighting conditions. The description of the added data is presented, and experimental baselines for text field recognition in different conditions. The dataset is available for download at ftp://smartengines.com/midv-500/extra/midv-2019/.
updated: Wed Oct 09 2019 14:12:27 GMT+0000 (UTC)
published: Wed Oct 09 2019 14:12:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト