arXiv reaDer
Iranis:ペルシア語のナンバープレート文字の大規模なデータセット
Iranis: A Large-scale Dataset of Farsi License Plate Characters
ディープニューラルネットワーク(DNN)を扱う場合、大量のデータを提供することが基本的な要求です。コンピュータビジョンの問題を解決するためにこれらのアルゴリズムを採用することで、畳み込みニューラルネットワーク(CNN)として知られる最も一般的な視覚画像の深い構造を提供するさまざまな画像データセットが登場しました。この点で、ナンバープレートの検出と光学式文字認識の目的で数百または数千もの画像を含むデータセットがいくつか見つかります。ただし、公に利用可能な画像データセットは、自動車のナンバープレートで使用されるペルシア語の文字を認識するためのそのようなデータを提供していません。法執行および監視の目的で正確な深層学習ベースのシステムを開発することには多くの利点があるため、ギャップを埋める必要があります。この論文では、イランの自動車のナンバープレートで使用されている数字と文字の画像を含む大規模なデータセットを紹介します。 Iranisという名前のデータセットには、さまざまなカメラでキャプチャされた実際のナンバープレート画像から収集されたペルシア語の数字と文字の83,000を超える画像が含まれています。カメラの撮影角度、照明、解像度、コントラストに関するさまざまなインスタンスにより、データセットはDNNのトレーニングに適した選択肢になります。データセット画像は、オブジェクト検出と画像分類のために手動で注釈が付けられます。最後に、ペルシア語の文字認識のベースラインを構築するために、このペーパーでは、YOLOv.3オブジェクト検出器を使用したパフォーマンス分析を提供します。
Providing huge amounts of data is a fundamental demand when dealing with Deep Neural Networks (DNNs). Employing these algorithms to solve computer vision problems resulted in the advent of various image datasets to feed the most common visual imagery deep structures, known as Convolutional Neural Networks (CNNs). In this regard, some datasets can be found that contain hundreds or even thousands of images for license plate detection and optical character recognition purposes. However, no publicly available image dataset provides such data for the recognition of Farsi characters used in car license plates. The gap has to be filled due to the numerous advantages of developing accurate deep learning-based systems for law enforcement and surveillance purposes. This paper introduces a large-scale dataset that includes images of numbers and characters used in Iranian car license plates. The dataset, named Iranis, contains more than 83,000 images of Farsi numbers and letters collected from real-world license plate images captured by various cameras. The variety of instances in terms of camera shooting angle, illumination, resolution, and contrast make the dataset a proper choice for training DNNs. Dataset images are manually annotated for object detection and image classification. Finally, and to build a baseline for Farsi character recognition, the paper provides a performance analysis using a YOLO v.3 object detector.
updated: Fri Jan 01 2021 18:54:44 GMT+0000 (UTC)
published: Fri Jan 01 2021 18:54:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト