Aerial Images Processing for Car Detection using Convolutional Neural Networks: Comparison between Faster R-CNN and YoloV3
 このペーパーでは、畳み込みニューラルネットワーク(CNN)を使用して空中画像から車を検出する問題に対処します。航空写真からの車両の特徴は識別しにくいため、この問題は、地上画像からの車(または任意のオブジェクト)の検出と比較して、追加の課題を提示します。この問題を調査するために、2つの最新のCNNアルゴリズム、つまり最も人気のある領域ベースのアルゴリズムであるFaster R-CNNと、最速の検出アルゴリズムであることが知られているYOLOv3のパフォーマンスを評価します。特性の異なる2つのデータセットを分析して、UAVの高度、カメラの解像度、オブジェクトサイズなどのさまざまな要因の影響を確認します。さまざまなハイパーパラメータ値の影響を明らかにするために、合計39回のトレーニング実験が行われました。この作業の目的は、空中画像の特定のドメインでこれら2つの最先端のアルゴリズム間で最も堅牢で徹底的な比較を行うことです。さまざまなメトリックを使用することで、テストデータセットのオブジェクトサイズとスケールがトレーニングデータセットのオブジェクトサイズとスケールと大きく異なる場合、再現率が低く、検出の信頼性が低いことを除いて、ほとんどの構成でYOLOv3のパフォーマンスが向上することを示しています。
In this paper, we address the problem of car detection from aerial images using Convolutional Neural Networks (CNN). This problem presents additional challenges as compared to car (or any object) detection from ground images because features of vehicles from aerial images are more difficult to discern. To investigate this issue, we assess the performance of two state-of-the-art CNN algorithms, namely Faster R-CNN, which is the most popular region-based algorithm, and YOLOv3, which is known to be the fastest detection algorithm. We analyze two datasets with different characteristics to check the impact of various factors, such as UAV's altitude, camera resolution, and object size. A total of 39 training experiments were conducted to account for the effect of different hyperparameter values. The objective of this work is to conduct the most robust and exhaustive comparison between these two cutting-edge algorithms on the specific domain of aerial images. By using a variety of metrics, we show that YOLOv3 yields better performance in most configurations, except that it exhibits a lower recall and less confident detections when object sizes and scales in the testing dataset differ largely from those in the training dataset.
updated: Wed Dec 22 2021 11:26:29 GMT+0000 (UTC)
published: Wed Oct 16 2019 09:25:35 GMT+0000 (UTC)
