さまざまなタイプの車両の位置を特定して分類するタスクは、交通監視から車両識別などに至るまで、自動化およびインテリジェント システムの多数のアプリケーションにおいて重要な要素になっています。最近では、ディープ ラーニング モデルが車両検出の分野を支配しています。それでも、バングラデシュの車両検出は比較的未踏の領域のままです。車両検出の主な目標の 1 つは、そのリアルタイム アプリケーションであり、「You Only Look Once」(YOLO) モデルが最も効果的なアーキテクチャであることが証明されています。この作業では、バングラデシュの交通画像から高速かつ正確な車両検出に最適な YOLO アーキテクチャを見つけることを目的として、YOLOV3、YOLOV5s、YOLOV5x などの YOLO ベースのアーキテクチャのさまざまなバリアントのパフォーマンス分析を実施しました。モデルは、DhakaAI データセット、Poribohon-BD データセット、および自己収集した画像からのサンプルで構成される 21 種類の車両に属する 7390 枚の画像を含むデータセットでトレーニングされました。徹底的な定量分析と定性分析の結果、YOLOV5x バリアントが最適なモデルであることがわかりました。YOLOv3 および YOLOv5s モデルよりも、mAP でそれぞれ 7 および 4 パーセント、精度で 12 および 8.5 パーセント優れたパフォーマンスを示しました。
The task of locating and classifying different types of vehicles has become a vital element in numerous applications of automation and intelligent systems ranging from traffic surveillance to vehicle identification and many more. In recent times, Deep Learning models have been dominating the field of vehicle detection. Yet, Bangladeshi vehicle detection has remained a relatively unexplored area. One of the main goals of vehicle detection is its real-time application, where `You Only Look Once' (YOLO) models have proven to be the most effective architecture. In this work, intending to find the best-suited YOLO architecture for fast and accurate vehicle detection from traffic images in Bangladesh, we have conducted a performance analysis of different variants of the YOLO-based architectures such as YOLOV3, YOLOV5s, and YOLOV5x. The models were trained on a dataset containing 7390 images belonging to 21 types of vehicles comprising samples from the DhakaAI dataset, the Poribohon-BD dataset, and our self-collected images. After thorough quantitative and qualitative analysis, we found the YOLOV5x variant to be the best-suited model, performing better than YOLOv3 and YOLOv5s models respectively by 7 & 4 percent in mAP, and 12 & 8.5 percent in terms of Accuracy.