モバイルデバイスを使用したIDドキュメントの認識は、広範なコンピュータービジョン研究のトピックになっています。顔の検出、文書の検出と修正、テキストフィールドの認識などのタスクを解決するための方法とアルゴリズムのポートフォリオが拡大しており、データセットの不足が重要な問題になっています。そのような方法を評価するためのオープンにアクセス可能なデータセットの1つは、さまざまな条件で50のIDドキュメントタイプのビデオクリップを含むMIDV-500です。ただし、MIDV-500での条件のキャプチャの変動性は、主に重要な投影歪みと異なる照明条件のいくつかの重要な問題に対処しませんでした。このホワイトペーパーでは、最新の高解像度モバイルカメラで撮影されたビデオクリップを含むMIDV-2019データセットを提示します。これには、強い投影歪みと低い照明条件があります。追加されたデータの説明と、さまざまな条件でのテキストフィールド認識の実験ベースラインが表示されます。データセットは、ftp://smartengines.com/midv-500/extra/midv-2019/からダウンロードできます。
Recognition of identity documents using mobile devices has become a topic of a wide range of computer vision research. The portfolio of methods and algorithms for solving such tasks as face detection, document detection and rectification, text field recognition, and other, is growing, and the scarcity of datasets has become an important issue. One of the openly accessible datasets for evaluating such methods is MIDV-500, containing video clips of 50 identity document types in various conditions. However, the variability of capturing conditions in MIDV-500 did not address some of the key issues, mainly significant projective distortions and different lighting conditions. In this paper we present a MIDV-2019 dataset, containing video clips shot with modern high-resolution mobile cameras, with strong projective distortions and with low lighting conditions. The description of the added data is presented, and experimental baselines for text field recognition in different conditions. The dataset is available for download at ftp://smartengines.com/midv-500/extra/midv-2019/.