arXiv reaDer
料金徴収のための新しいデータセットによる車両とナンバープレート認識
Vehicle and License Plate Recognition with Novel Dataset for Toll Collection
車種認識、ナンバープレートの位置特定、読み取りの3つのステップで構成される、料金徴収の自動フレームワークを提案します。ただし、いくつかの要因によって画像が変化するため、3つのステップのそれぞれが重要になります。フロントの伝統的な車両装飾は、同じタイプの車両間でばらつきを引き起こします。これらの装飾は、深刻な背景の乱雑さと部分的な閉塞のために、ナンバープレートの位置特定と認識を困難にします。同様に、ほとんどの車両、特にトラックでは、ナンバープレートの位置は一貫していません。最後に、ナンバープレートの読み取りの場合、バリエーションは、不均一なフォントスタイル、サイズ、および部分的に隠された文字と数字によって引き起こされます。提案されたフレームワークは、バックボーンディープラーニングアーキテクチャのデータ可用性とパフォーマンス評価の両方を利用します。 6つの車両タイプに属する10kの画像で構成される、新しいデータセットである多様な車両とナンバープレートのデータセット(DVLPD)を収集します。次に、各画像に、車両タイプ、ナンバープレート、およびその文字と数字について手動で注釈が付けられます。 3つのタスクのそれぞれについて、You Only Look Once(YOLO)v2、YOLOv3、YOLOv4、およびFasterRCNNを評価します。 Raspberry Piにリアルタイムで実装するために、TinyYOLOv3およびTinyYOLOv4という名前の軽量バージョンのYOLOを評価します。車両タイプ認識で98.8%、ナンバープレート検出で98.5%、ナンバープレート読み取りで98.3%の最高の平均平均精度(mAP@0.5)は、YOLOv4によって達成されますが、より軽いバージョン、つまりTinyYOLOv4は車種認識、ナンバープレート検出、ナンバープレート読み取りでそれぞれ97.1%、97.4%、93.7%。データセットとトレーニングコードはhttps://github.com/usama-x930/VT-LPRで入手できます。
We propose an automatic framework for toll collection, consisting of three steps: vehicle type recognition, license plate localization, and reading. However, each of the three steps becomes non-trivial due to image variations caused by several factors. The traditional vehicle decorations on the front cause variations among vehicles of the same type. These decorations make license plate localization and recognition difficult due to severe background clutter and partial occlusions. Likewise, on most vehicles, specifically trucks, the position of the license plate is not consistent. Lastly, for license plate reading, the variations are induced by non-uniform font styles, sizes, and partially occluded letters and numbers. Our proposed framework takes advantage of both data availability and performance evaluation of the backbone deep learning architectures. We gather a novel dataset, Diverse Vehicle and License Plates Dataset (DVLPD), consisting of 10k images belonging to six vehicle types. Each image is then manually annotated for vehicle type, license plate, and its characters and digits. For each of the three tasks, we evaluate You Only Look Once (YOLO)v2, YOLOv3, YOLOv4, and FasterRCNN. For real-time implementation on a Raspberry Pi, we evaluate the lighter versions of YOLO named Tiny YOLOv3 and Tiny YOLOv4. The best Mean Average Precision (mAP@0.5) of 98.8% for vehicle type recognition, 98.5% for license plate detection, and 98.3% for license plate reading is achieved by YOLOv4, while its lighter version, i.e., Tiny YOLOv4 obtained a mAP of 97.1%, 97.4%, and 93.7% on vehicle type recognition, license plate detection, and license plate reading, respectively. The dataset and the training codes are available at https://github.com/usama-x930/VT-LPR
updated: Tue Nov 15 2022 05:39:37 GMT+0000 (UTC)
published: Fri Feb 11 2022 14:11:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト