無人航空機 (UAV) による物体検出は、コンピューター ビジョンの研究分野で大きな注目を集めています。しかし、UAV から取得したデータで物体を正確に検出するのは簡単ではありません。UAV は非常に高い高度から画像を撮影するため、画像には検出が難しい小さな物体サイズが多く含まれます。この課題を動機として、私たちはバックボーン ダークネット 53 の末端に空間ピラミッド プーリング (SPP) レイヤーを追加することで 1 段階検出器 YOLOv3 のパフォーマンスを向上させ、UAV による物体検出タスクでより効率的な特徴抽出プロセスを取得することを目指しています。 。また、YOLOv3 メソッドのさまざまなバージョンについての評価研究も実施しました。 VisDrone2019-Det データセットを使用して分析した YOLOv3 with SPP、YOLOv3、YOLOv3-tiny が含まれます。ここでは、SPP を使用した YOLOv3 が、640x640 の入力スケールで YOLOv3 よりも 0.6%、YOLOv3-Tiny よりも 26.6% 高い結果を得ることができ、他のバージョンの YOLOv3 メソッドよりも異なる入力画像スケールでも精度を維持できることを示します。これらの結果は、YOLOv3 への SPP レイヤーの追加が、UAV から取得したデータを使用した物体検出方法のパフォーマンスを向上させるための効率的なソリューションとなり得ることを証明しています。
Object detection with Unmanned Aerial Vehicles (UAVs) has attracted much attention in the research field of computer vision. However, not easy to accurately detect objects with data obtained from UAVs, which capture images from very high altitudes, making the image dominated by small object sizes, that difficult to detect. Motivated by that challenge, we aim to improve the performance of the one-stage detector YOLOv3 by adding a Spatial Pyramid Pooling (SPP) layer on the end of the backbone darknet-53 to obtain more efficient feature extraction process in object detection tasks with UAVs. We also conducted an evaluation study on different versions of YOLOv3 methods. Includes YOLOv3 with SPP, YOLOv3, and YOLOv3-tiny, which we analyzed with the VisDrone2019-Det dataset. Here we show that YOLOv3 with SPP can get results mAP 0.6% higher than YOLOv3 and 26.6% than YOLOv3-Tiny at 640x640 input scale and is even able to maintain accuracy at different input image scales than other versions of the YOLOv3 method. Those results prove that the addition of SPP layers to YOLOv3 can be an efficient solution for improving the performance of the object detection method with data obtained from UAVs.