軍事用途から産業用途まで、さまざまな分野でドローンの使用が大幅に増加しています。それらが提供するすべての利点にもかかわらず、それらの誤用は事故につながる可能性があり、それらに取り組むことは、特に夜間には小型で視界が悪いため、より困難になります.これらの制限を克服し、夜間の検出精度を向上させるために、赤外線 (IR) 画像用のゴースト オート アンカー ネットワーク (GAANet) と呼ばれるオブジェクト検出器を提案します。この検出器は YOLOv5 コアを使用して、IR 画像のオブジェクト検出における課題に対処します。たとえば、高度の拡張、照明不足、画像解像度の低さによって引き起こされる精度の低さや誤警報率の高さなどです。パフォーマンスを向上させるために、自動アンカー計算を実装し、従来の畳み込みブロックをゴースト畳み込みに変更し、入力チャネル サイズを調整し、AdamW オプティマイザーを使用しました。マルチスケールの小さな物体認識の精度を高めるために、追加の極小物体特徴抽出器と検出器も導入しました。複数のクラス (鳥、ドローン、飛行機、ヘリコプター) を持つカスタム IR データセットの実験結果は、GAANet が最先端の検出器と比較して改善を示すことを示しています。 GhostNet-YOLOv5 と比較して、GAANet は全体的な平均精度 (mAP@50)、再現率、および精度がそれぞれ 2.5%、2.3%、および 1.4% ほど高くなっています。このペーパーのデータセットとコードは、https://github.com/ZeeshanKaleem/GhostAutoAnchorNet でオープン ソースとして入手できます。
The usage of drones has tremendously increased in different sectors spanning from military to industrial applications. Despite all the benefits they offer, their misuse can lead to mishaps, and tackling them becomes more challenging particularly at night due to their small size and low visibility conditions. To overcome those limitations and improve the detection accuracy at night, we propose an object detector called Ghost Auto Anchor Network (GAANet) for infrared (IR) images. The detector uses a YOLOv5 core to address challenges in object detection for IR images, such as poor accuracy and a high false alarm rate caused by extended altitudes, poor lighting, and low image resolution. To improve performance, we implemented auto anchor calculation, modified the conventional convolution block to ghost-convolution, adjusted the input channel size, and used the AdamW optimizer. To enhance the precision of multiscale tiny object recognition, we also introduced an additional extra-small object feature extractor and detector. Experimental results in a custom IR dataset with multiple classes (birds, drones, planes, and helicopters) demonstrate that GAANet shows improvement compared to state-of-the-art detectors. In comparison to GhostNet-YOLOv5, GAANet has higher overall mean average precision (mAP@50), recall, and precision around 2.5%, 2.3%, and 1.4%, respectively. The dataset and code for this paper are available as open source at https://github.com/ZeeshanKaleem/GhostAutoAnchorNet.