オブジェクト検出パイプラインは、シーンをキャプチャするカメラと、これらの画像を処理するオブジェクト検出器で構成されます。画像の品質は、オブジェクト検出器のパフォーマンスに直接影響します。今日の多くの研究は、画質の改善または物体検出モデルの独立した改善のいずれかに焦点を合わせていますが、2つのサブシステムの共同最適化の重要性を無視しています。この論文の目的は、オブジェクト検出器に合わせた入力画像の最適化に焦点を当てることにより、リモートセンシングシナリオでの既存のオブジェクト検出器の検出スループットと精度を調整することです。これを実現するために、これらのアプリケーションで選択した2つのカメラキャリブレーションパラメーター(カメラ歪み補正とガンマ補正)と5つの画像パラメーター(量子化、圧縮、解像度、カラーモデル、追加チャネル)の影響を経験的に分析します。私たちの実験では、異なるドメインからの3つのUAVデータセットと、大小の最先端のオブジェクト検出器モデルの混合を利用して、パイプラインパラメータの影響の広範な評価を提供します。最後に、UAVの組み込みプラットフォームでオブジェクト検出パイプラインのプロトタイプを実現し、その結果に基づいてオブジェクト検出パイプラインを構築するためのベストプラクティスの推奨事項を示します。すべてのパラメーターが検出精度とデータスループットに同等の影響を与えるわけではなく、パラメーター間の適切な妥協点を使用することで、同じデータスループットを維持しながら、軽量オブジェクト検出モデルの検出精度を高めることができることを示します。
An object detection pipeline comprises a camera that captures the scene and an object detector that processes these images. The quality of the images directly affects the performance of the object detector. Many works nowadays focus either on improving the image quality or improving the object detection models independently, but neglect the importance of joint optimization of the two subsystems. The goal of this paper is to tune the detection throughput and accuracy of existing object detectors in the remote sensing scenario by focusing on optimizing the input images tailored to the object detector. To achieve this, we empirically analyze the influence of two selected camera calibration parameters (camera distortion correction and gamma correction) and five image parameters (quantization, compression, resolution, color model, additional channels) for these applications. For our experiments, we utilize three UAV data sets from different domains and a mixture of large and small state-of-the-art object detector models to provide an extensive evaluation of the influence of the pipeline parameters. Finally, we realize an object detection pipeline prototype on an embedded platform for an UAV and give a best practice recommendation for building object detection pipelines based on our findings. We show that not all parameters have an equal impact on detection accuracy and data throughput, and that by using a suitable compromise between parameters we are able to achieve higher detection accuracy for lightweight object detection models, while keeping the same data throughput.