DC-SPP-YOLO: オブジェクト検出のための高密度接続と空間ピラミッド プーリング ベースの YOLO
DC-SPP-YOLO: Dense Connection and Spatial Pyramid Pooling Based YOLO for Object Detection
YOLOv2 メソッドは物体検出が非常に高速ですが、バックボーン ネットワークのパフォーマンスが低く、マルチスケール領域の機能が十分に活用されていないため、検出精度が制限されます。したがって、本論文では、YOLOv2の物体検出精度を改善するための密結合(DC)および空間ピラミッドプーリング(SPP)ベースのYOLO(DC-SPP-YOLO)法を提案する。具体的には、畳み込み層の密な接続がYOLOv2のバックボーンネットワークで採用され、特徴抽出を強化し、勾配消失問題を軽減します。さらに、ネットワークがオブジェクトの特徴をより包括的に学習できるように、マルチスケール領域の特徴をプールして連結するために、改善された空間ピラミッド プーリングが導入されています。 DC-SPP-YOLO モデルは、MSE (平均二乗誤差) 損失とクロスエントロピー損失で構成される新しい損失関数に基づいて確立およびトレーニングされます。実験結果は、DC-SPP-YOLOのmAP(平均平均精度)が、PASCAL VOCデータセットおよびUA-DETRACデータセットでのYOLOv2のmAPよりも高いことを示しました。提案した DC-SPP-YOLO 法の有効性を実証した.
Although the YOLOv2 method is extremely fast on object detection, its detection accuracy is restricted due to the low performance of its backbone network and the underutilization of multi-scale region features. Therefore, a dense connection (DC) and spatial pyramid pooling (SPP) based YOLO (DC-SPP-YOLO) method for ameliorating the object detection accuracy of YOLOv2 is proposed in this paper. Specifically, the dense connection of convolution layers is employed in the backbone network of YOLOv2 to strengthen the feature extraction and alleviate the vanishing-gradient problem. Moreover, an improved spatial pyramid pooling is introduced to pool and concatenate the multi-scale region features, so that the network can learn the object features more comprehensively. The DC-SPP-YOLO model is established and trained based on a new loss function composed of MSE (mean square error) loss and cross-entropy loss. The experimental results indicated that the mAP (mean Average Precision) of DC-SPP-YOLO is higher than that of YOLOv2 on the PASCAL VOC datasets and the UA-DETRAC datasets. The effectiveness of DC-SPP-YOLO method proposed is demonstrated.
updated: Sun Sep 04 2022 07:11:47 GMT+0000 (UTC)
published: Wed Mar 20 2019 16:19:20 GMT+0000 (UTC)
