モバイルデバイスでのIDドキュメントの分析と認識に多くの研究が費やされてきました。ただし、この特定の問題のために設計された公的に利用可能なデータセットは現在存在しません。関連するサブタスクに役立つデータセットはいくつかありますが、IDドキュメントの認識に対するより包括的な科学的および技術的アプローチを促進するには、より専門的なデータセットが必要です。このペーパーでは、50種類のIDドキュメントの500個のビデオクリップで構成されるモバイルIDドキュメントビデオデータセット(MIDV-500)を提供します。これにより、幅広いドキュメント分析問題の調査が可能になります。この論文では、データセットの特徴と、顔検出、テキスト行認識、およびドキュメントフィールドデータ抽出の既存の方法の評価結果を示します。身分証明書の重要な特徴は個人データを含むため機密性があるため、MIDV-500で使用されるすべてのソース文書画像はパブリックドメインにあるか、パブリック著作権ライセンスの下で配布されます。このペーパーの主な目標は、データセットを提示することです。ただし、さらにベースラインとして、提示されたデータセットを使用して、顔検出、テキスト行認識、およびドキュメントデータ抽出の既存の方法の評価結果を提示します。 (データセットは、ftp://smartengines.com/midv-500/からダウンロードできます。)
A lot of research has been devoted to identity documents analysis and recognition on mobile devices. However, no publicly available datasets designed for this particular problem currently exist. There are a few datasets which are useful for associated subtasks but in order to facilitate a more comprehensive scientific and technical approach to identity document recognition more specialized datasets are required. In this paper we present a Mobile Identity Document Video dataset (MIDV-500) consisting of 500 video clips for 50 different identity document types with ground truth which allows to perform research in a wide scope of document analysis problems. The paper presents characteristics of the dataset and evaluation results for existing methods of face detection, text line recognition, and document fields data extraction. Since an important feature of identity documents is their sensitiveness as they contain personal data, all source document images used in MIDV-500 are either in public domain or distributed under public copyright licenses. The main goal of this paper is to present a dataset. However, in addition and as a baseline, we present evaluation results for existing methods for face detection, text line recognition, and document data extraction, using the presented dataset. (The dataset is available for download at ftp://smartengines.com/midv-500/.)